Google ha appena rilasciato una nuova funzionalità all’interno di Gemini: la creazione musicale. Ho avuto modo di testarla in anteprima (sono nel programma di beta testing) e nel mio ultimo video vi mostro esattamente come funziona e quali sono i risultati.
Gemini è il primo chatbot ad integrare un modello di generazione di brani musicali. Sfrutta il modello Lyria 3, sviluppato da Google DeepMind. Le tracce audio possono essere create a partire da una descrizione testuale o anche da un’immagine caricata (in questo caso il modello “vede” l’immagine e crea musica ispirata ad essa).
Nel mio video ho messo alla prova il sistema con diversi scenari per capirne le potenzialità e i limiti:
- Colonne sonore: ho chiesto un brano di apertura per un film epico.
- Podcast: ho generato una base “ambient” non invadente.
- Jazz: un tentativo di replicare lo stile di Miles Davis (spoiler: il risultato è interessante, anche se non perfetto).
- Canzoni in italiano: ho provato a creare un brano rock in stile Vasco Rossi e un jingle pubblicitario. Qui emergono i limiti attuali sui testi in lingua italiana, ancora un po’ banali.
Per chi è pensato?
È importante notare che questo strumento non nasce per competere con giganti dedicati come Suno o Udio, rivolti ai professionisti. La funzione “Crea Musica” di Gemini è uno strumento “generalista”, perfetto per chi deve creare velocemente una base per un video social, un sottofondo per una presentazione o un jingle, senza dover gestire diritti d’autore complessi.
Le tracce sono scaricabili in MP3 (192kbps) o video, ma nella fase di lancio sono limitate a circa 30 secondi.

