Stable Diffusion è stato uno dei primi modelli di generazione di immagini da testo, prodotto dall’azienda Stability AI. Si tratta di un modello di diffusione latente, una variante di rete neurale generativa profonda sviluppata dal gruppo CompVis alla Università Ludwig Maximilian di Monaco. Il modello è stato rilasciato grazie ad una collaborazione tra Stability AI, CompVis LMU e Runway con il supporto di EleutherAI e LAION.
Non molto noto al grande pubblico, ma molto diffuso tra gli addetti ai lavori perché è stato pubblicato con licenza open source, per cui chiunque può installarlo sul proprio computer e utilizzarlo gratuitamente (a patto di avere una scheda grafica potente).
Chi non vuole impelagarsi nell’istallazione può usare due servizi web di Stability AI, Clipdrop o DreamStudio. Quest’ultimo è molto più adatto perché ha una comoda interfaccia dalla quale usare gli ultimi modelli di Stable Diffusion. L’ultimo si chiama SDXL 1.0 e rappresenta un bel passo in avanti rispetto alle precedenti. In questo video tutorial proviamo a capire come usarlo e quanto sia comparabile a Midjourney.