ElevenLabs è l’azienda, che più di altre, sta innovando nell’applicazione di algoritmi di intelligenza artificiale generativa all’audio. In particolare alla voce umana. Qualche mese fa vi avevo parlato delle funzioni di Speech Synthesis per usare “voci sintetiche” nella lettura di testi scritti e di VoiceLab che permette di creare voci inesistenti e anche di clonare la propria voce.
Ora Elevenlabs ha migliorato la sua interfaccia e rinominato “Speech Synthesis” in un più chiaro “Text to Speech”. Inoltre, ha aggiunto una nuova strabiliante funzione, detta di “Speech to Speech”. Consente di caricare un nostro audio e di trasformarlo in una voce scelta, tra le centinaia messe a disposizione o clonate da noi. La cosa fantastica è che il risultato sarà identico all’originale in termine di inflessioni e sfumature vocali.
Per capire di cosa si tratta e come funziona, vi consiglio di guardare il mio video test.