Siamo verso la fine del 2025 e un punto fermo in questa evoluzione del mercato dell’intelligenza artificiale generativa è che ci sono almeno due grandi aziende che stanno progettando dei prodotti di intelligenza artificiale generativa pensati soprattutto per conquistare il grande pubblico. Mi riferisco a OpenAI con ChatGPT, che 3 anni fa ha aperto questo mercato, e a Google con Gemini, che ha guadagnato terreno introducendo innovazioni significative.
Una tattica che si è rivelata molto efficace per la conquista di nuovi consumatori è stata l’introduzione di un modello di generazione di immagini all’interno di ChatGPT, il modello GPT-Image-1, che ha conquistato molti consumatori per la sua semplicità di utilizzo (ad esempio la trasformazione di una propria foto in un cartoon stile Ghibli, che ha fatto il giro della rete).
Recentemente anche Google ha seguito la stessa tattica, introducendo un modello simile per la creazione di immagini all’interno del suo chatbot Gemini (noto come Nano Banana o meglio Gemini 2.5 Flash Image).
Quando usare Gemini e quando ChatGPT per le immagini
Ma quale dei due modelli è il migliore? In questo mio video test li ho messi alla prova su diversi task, dalla creazione di asset per il marketing all’editing granulare di immagini con foto di prodotto reali.
Emerge che ChatGPT è utile quando bisogna creare immagini con testi in italiano all’interno, elementi visivi con sfondo trasparente, infografiche o immagini che simulano stili grafici/fotografici (per approfondire vi consiglio di scaricare la guida completa e le guide agli stili)
Gemini Nano Banana è consigliabile quando dovete modificare dettagliatamente delle immagini, ad esempio togliere o sostituire elementi, mantenendo intatto tutto il resto oppure quando dovete combinare più elementi in un’unica immagine o estrarre elementi da un’immagine.
Oltre a vedere il video, potete scaricare la mia guida gratuita a Gemini per la creazione e la modifica di immagini.