In questi giorni la rete degli appassionati di IA generativa è andata in visibilio per Flux, un modello etichettato come il “Midjourney Killer”. Così ho voluto testarlo per capire meglio se ciò fosse vero.
Flux 1.0 è un modello di intelligenza artificiale generativa text to image, quindi per la generazione di immagini sulla base di un prompt testuale. È stato sviluppato da Black Forest Labs, startup fondata da ingegneri che avevano già lavorato a Stable Diffusion, il modello open source di riferimento per la creazione di immagini.
L’azienda, che ha già incassato finanziamenti per 31 milioni di dollari, è determinata a “spingere i confini della creatività, dell’efficienza e della diversità” non solo nella generazione di immagini statiche, ma anche in movimento (infatti sta lavorando anche ad un modello text to video).
La società a fine agosto 2024 ha completato un round di finanziamenti da ben 31 milioni di dollari, e si propone come un attore di primo piano nel settore della generazione di immagini. Si presenta sul mercato con tre versione di Flux 1.0: pro, dev e schnell.
- Pro è il modello più avanzato in termini di qualità e diversità degli output, ma è “closed source”. Può essere usato commercialmente ed è accessibile via API;
- Dev è la versione pensata per gli sviluppatori che vogliono sfruttarla per le proprie creazioni. Offre una qualità simile alla versione pro, ma è più efficiente. È offerto in modalità “open weight” per cui i pesi sono disponibili, ma non può essere usata per scopi commerciali;
- Schnell è il modello più veloce, ma di qualità inferiore. Viene offerto in modalità open source con licenza Apache 2.0 per uso commerciale.
In questo video ho testato Flux 1.0 Pro attraverso il sito Replicate, che vi fa creare una ventina di immagini gratuitamente e poi pagare pochi centesimi per ogni ulteriore generazione. Nel mio test ho anche messo a confronto Flux 1.0 con Midjourney. Buona visione!