I chatbot basati su modelli linguistici di grandi dimensioni sono nati per generare testi sulla base di nostri input. Ora, però, si stanno arricchendo di una nuova funzione, la voce. In pratica, vengono addestrati non solo su testi ma anche su audio di persone in modo da riuscire a simulare delle conversazioni naturali, anche grazie a modelli text to speech.
Al momento, questa possibilità è disponibile su ChatGPT di OpenAI e su Gemini di Google (qui si chiama Gemini Live). In entrambi i casi si attiva dall’app, cliccando su un’icona in basso a destra che rappresenta le onde sonore.
La modalità vocale, fondamentale per chi ha problemi di vista, è destinata a cambiare il nostro rapporto con questi “assistenti intelligenti”. La voce è un’interfaccia molto più consona alla rapidità del nostro tempo e rende l’utilizzo di questi strumenti molto più comodo.
In questo video vi mostro come la voce può trasformare ogni momento della vostra giornata, con esempi concreti che vi sorprenderanno: dalla ricerca di notizie alla raccolta di appunti, dal supporto allo studio ai consigli personalizzati. Buona visione.