Ormai è chiaro che le tecniche di intelligenza artificiale generativa stanno trasformando prepotentemente tutte le attività creative. Finora ne abbiamo visto l’uso nella creazione di testi (strumenti come ChatGPT, Gemini, Claude, Mistral, Perplexity), immagini (Midjourney, Adobe Firefly, Leonardo AI, Dreamstudio, Freepik, Ideogram), video (Runway, Pika, Dream Machine) musica (Suno, Mubert e Udio) e nella clonazione di voci (strumenti come ElevenLabs).
Una cosa che mancava era la realizzazione di effetti sonori che, sappiamo essere molto importanti per arricchire e dare profondità a video e a podcast. Ma da qualche tempo sono arrivati sul mercato anche dei tool di intelligenza artificiale per aiutare i professionisti in questa attività, che finora si basava soprattutto sull’acquisto di effetti da banche sonore online.
Per capire a che punto queste innovazioni sono arrivate, ho testato due nuovi software per la generazione di effetti sonori di vario tipo (ambientali, di animali, di macchine, rumori, ecc.).
- Il primo tool “text to SFX” è dell’azienda ElevenLabs, già nota per il suo egregio lavoro sul text to speech, speech to speech e clonazione delle voci. Ora, attivando un abbonamento da 5 dollari al mese, è possibile scrivere la descrizione dell’effetto sonoro che si vuole e, in pochi secondi, ottenere quattro alternative tra le quali scegliere. I suoni sono di alta qualità a 192 Kbps.
- il secondo software si chiama OptimizerAI e l’utilizzo è identico: si scrive la descrizione e si ottiene il suono. Qui si può partire con un account gratuito e sfruttare i 75 crediti mensili associati. Alcune funzioni utili sono quelle che danno la possibilità di aumentare la qualità del suono e chiedere delle variazioni per ottenere effetti similari.
In entrambi i casi i file audio prodotti possono essere liberamente utilizzati per progetti commerciali.
Per scoprire come funzionano i due software vi consiglio di dare un’occhiata al video in basso.