Google I/O, l’evento annuale dedicato agli sviluppatori, è stato più sorprendente del solito perché ha messo al centro la privacy e l’uso della tecnologia per migliorare concretamente la vita delle persone.
Sundar Pichai ha aperto la conferenza ricordando la solita missione dell’azienda “organizzare l’informazione mondiale e renderla utile e accessibile a tutti”, ma ponendo l’accento sull’ultima parte ossia il tentativo di “rendere disponibili prodotti in grado di aumentare la conoscenza, il successo, la salute, la felicità”. Poteva sembrare la solita retorica, ma poi gli speaker hanno mostrato i reali progressi fatti in tal senso.
Intelligenza Artificiale per migliorare la vita delle persone
Alla base di tutte le innovazioni presentate c’è la ricerca nell’ambito dell’Intelligenza Artificiale. Quella che coinvolge i campi del Natural Language Understanding, Speech-To-Text e Text-To-Speech, ha dato vita ad alcune sorprendenti funzioni.
Live Caption è quella che permette di aggiungere in real time i sottotitoli a qualunque video (anche se l’audio non è udibile) e anche di operare una traduzione.
Live Relay consente, durante una telefonata con una persona con disabilità uditive, di trasformare la voce in testo e di permettere una risposta testuale che viene immediatamente trasformata in voce.
Live Transcribe, funzione pensata per aiutare le persone con problemi uditivi e di linguaggio, riesce a trascrivere in tempo reale le frasi dell’interlocutore senza problemi e a consentire un dialogo, senza bisogno di un interprete. Oltre a ciò è stato messo in piedi il progetto Euphonia che ha l’obiettivo di costruire modelli per il riconoscimento della voce di persone che hanno gravi problemi di linguaggio. Per coloro che hanno perso l’uso della parola viene messo a disposizione un sistema in grado di addestrare il software a compiere azioni, es. accendere le luci, semplicemente interpretando dei suoni o espressioni facciali.
Molto promettente è l’uso dell’Intelligenza Artificiale per assistere i medici nella diagnosi precoce della retinopatia diabetica e del cancro ai polmoni. In un caso il sistema è stato in grado di individuare quest’ultimo nelle fasi iniziali di insorgenza, mentre 5 medici su 6 avevano fallito. Ciò è possibile grazie al miglioramento di modelli di deep learning per il riconoscimento di tumori dall’analisi delle TAC.
L’Assistente di prossima generazione
L’Assistente vocale integrato nei device di Google è stato migliorato grazie ai progressi nel campo dell’Intelligenza Artificiale, che hanno permesso di portare i modelli finora residenti nel cloud all’interno del chip dello smartphone (con una compressione da 100 GB a mezzo gigabyte). In questo modo l’interlocuzione con l’assistente diventa 10 volte più veloce, non necessita di connessione e i dati relativi restano nel telefono, garantendo la privacy dell’utente. Inoltre, durante una conversazione a più fasi, è stato eliminata la necessità di ripetere continuamente “hey Google” e per interrompere una sveglia basterà dire “stop”.
Duplex on the web. L’anno scorso era stata presentata la tecnologia Duplex che permetteva di chiedere all’assistente di fare azioni, esempio prenotare un ristorante, eseguendo una conversazione con un umano al posto dell’utente. Con il nuovo “Duplex on the web” si riuscirà a chiedere ed ottenere il completamento di un task attraverso internet, ad esempio la prenotazione di un auto a noleggio o di un posto al cinema, in maniera automatica.
Privacy al centro di Google
Grande enfasi è stata posta sul tema della privacy, evitando proclami fumosi, come fatto da Zuckerberg qualche giorno prima, ma mostrando prodotti concreti. Pichai dice: per la massima personalizzazione dei servizi è necessario condividere informazioni personali, ma l’utente potrà sempre decidere quando interromperla.
Il controllo dei dati che si condividono può già avvenire accedendo al proprio Google Account, ma tale attività sarà messa ben in vista nel prossimo sistema operativo, Android Q, e nei prodotti di punta.
Oltre a cancellare immediatamente i propri dati di navigazione, ora l’utente potrà impostare un periodo di 3 o 18 mesi per eseguire un’auto cancellazione.
Inoltre la modalità Incognito, già disponibile su Chrome, verrà estesa anche a Maps, YouTube e Search.
Realtà aumentata nel motore di ricerca e Google Lens
Innovazioni anche rispetto al motore di ricerca, che d’ora in poi mostrerà anche podcast, il cui audio sarà indicizzato, e modelli 3D, che potranno essere trasposti anche nell’ambiente fisico circostante in modo da poterli studiare meglio.
Migliorato anche Google Lens che usa la fotocamera, la “computer vision” e la realtà aumentata per sovrapporre informazioni al contesto fisico. Sarà possibile inquadrare un menù per vedere la traduzione dei piatti, quelli più ordinati e vederne le foto.
Google Lens, utile soprattuto per la traduzione istantanea di quanto inquadrato, sarà anche utilizzabile nei telefoni che costano meno di 50$ (chiamati Google Go e venduti nei paesi in via di sviluppo) perché sono riusciti a comprimere le sue istruzioni in appena 100KB.
Questo appuntamento ha evidenziato che Google vuole porsi come leader consapevole nel campo dell’Intelligenza Artificiale (è stato presentato il metodo TCAV per individuare i bias nei modelli) e attento alle questioni della privacy (provando a guadagnare terreno nei confronti di Apple). La conquista della fiducia delle persone è il terreno su cui si giocherà la sfida tra i big della tecnologia.