Dopo ben 5 mesi dall’annuncio ufficiale, OpenAI ha iniziato il rilascio di “Advanced Voice Mode”, la funzione vocale avanzata di ChatGPT. Il software era già in grado di accettare la voce in input e di riprodurre l’audio delle sue risposte, ma lo faceva in maniera molto rudimentale e con molti problemi. In pratica, prendeva la nostra voce, la trasformava in testo (eventualmente operando una traduzione tra lingue), elaborava una risposta testuale e la riproduceva vocalmente utilizzando un modello text to speech. Un processo lungo che produceva ritardi e perdita di frammenti di traduzione.
Invece, il nuovo modello alla base della “modalità vocale avanzata” è stato nativamente addestrato con enormi quantità di contenuti audio per cui è in grado di “comprendere” immediatamente il nostro parlato e di rispondere senza operare trasformazioni testo-audio e viceversa. Il risultato è la possibilità di fare conversazioni fluide con la macchina, anche interrompendola senza problemi.
Come attivare la voce di ChatGPT in Italia
La nuova funzione vocale è disponibile per tutti gli abbonati a ChatGPT Plus e Team, ma non ai residenti dell’Unione Europea, UK, Svizzera, Islanda, Norvegia e Liechtenstein. Per il momento siamo penalizzati dall’AI Act che non tollera applicazioni di IA in grado di inferire lo stato d’animo dell’utente.
Quindi per dialogare con ChatGPT bisogna scaricare e attivare una VPN, impostata su uno dei paesi coperti dal servizio.
Bisogna tener presente che il modello vocale non può accedere al web e non ha la capacità di vedervi (funzione che arriverà in futuro). La sua conoscenza è aggiornata ad ottobre 2023.
Nel video che ho girato ho testato la funzione chiedendo al bot di cambiare accento, tono, lingua. L’ho anche utilizzato come insegnante per imparare una materia o una lingua straniera, come coach per preparare un’intervista e per farmi raccontare una storia e creare una campagna pubblicitaria per la radio. Buona visione!