L’intelligenza artificiale applicata alla generazione delle immagini è, ormai, ad un livello molto elevato. L’asticella si è alzata molto nel 2024 e le aziende tecnologiche del settore stanno andando verso incredibili livelli di realismo. Il campione da battere è Midjourney con un modello proprietario che da oltre due anni permette di ottenere risultati straordinari.
Google, da molto tempo fa ricerca sul text to image, ma non ha mai spinto molto sull’acceleratore del realismo per evitare usi distorti delle sue tecnologie (ad esempio per la produzione di fake news). Il suo ultimo modello Imagen 3 fa notare un netto miglioramento rispetto al passato, sia nella qualità dell’output che nella capacità di comprensione del prompt dell’utente. Ma l’azienda ha limitato molto la creatività degli utenti, impostando dei “guardrail” molto stringenti (spesso anche citare “una bella ragazza” fa scattare il rifiuto di generare l’immagine).
In questi mesi ho avuto accesso alla versione beta e l’ho testata per bene attraverso il servizio ImageFX. Solo ora che è stato reso pubblico ho potuto registrare questo video tutorial. Al momento, ImageFX è accessibile gratuitamente, ma solo tramite VPN dall’Italia.