Gemini 3: il grande salto di Google

Il dibattito sulle capacità degli LLM (“Is AI hitting a wall?”) è stato messo a tacere il 18 novembre, quando Google ha portato sul mercato Gemini 3 Pro. Il nuovo modello presenta dei punteggi molto più elevati degli altri competitor su diversi benchmark complessi: Humanity’s Last Exam (37.5%), Video-MMMU (87.6%), ARC-AGI-2 (31%).

Ho testato in anteprima questa versione come beta tester per un paio di settimane e vi racconto la mia esperienza in questo video. Il verdetto è positivo, con alcuni limiti. Come sempre con i modelli probabilistici, questi test offrono indicazioni utili, ma non definitive.

Video Analysis: il vero punto di forza

L’ambito in cui Gemini 3.0 distanzia nettamente i competitor (GPT-5.1 incluso) è la Video Analysis nativa. Nei miei test, il modello ha analizzato un trailer cinematografico descrivendo le scene, individuando momenti specifici al secondo e interpretando le emozioni dei protagonisti. Anche quando ho caricato un mio video tutorial di 45 minuti: il sistema ha restituito i momenti salienti con timestamp precisi.
Questa capacità deriva dall’addestramento multimodale (testi, immagini, video, suoni) e dalla “context window” di 1 milione di token (piani Pro e Ultra), che permette di processare file fino a 1 ora di video.

Ragionamento e creatività

Sul ragionamento logico, Gemini 3.0 mostra abilità notevoli anche senza attivare la funzione “Deep Think”. L’ho testato con la “Ghigliottina”, il gioco di associazioni che richiede pensiero laterale oltre che una vasta conoscenza, ed ha risolto l’enigma senza esitazioni, a differenza di GPT-5.1 e di altri modelli che ho testato.

Sono rimasto particolarmente sorpreso per il salto in avanti che è stato fatto nella scrittura creativa. I vecchi modelli di Google erano sempre molto freddi e istituzionali nello stile, questo invece mi ha dato risultati più convincenti.

Coding: risultati alterni

Nella scrittura di codice, Gemini 3 supera Claude Sonnet in alcuni benchmark. Nei miei test da profano del “vibe coding” i risultati sono stati discontinui: a volte ha incontrato errori nella creazione di dashboard interattive a partire da foglio elettronico caricato. Poi però mi ha generato una bella visualizzazione 3D del sistema solare, completamente navigabile. Devo aggiungere che, nei giorni successivi al rilascio al pubblico, ho notato dei miglioramenti.

Per gli sviluppatori Google ha presentato Antigravity, piattaforma di sviluppo agentivo gratuita in preview pubblica per Mac, Windows e Linux. Non è un semplice IDE AI con assistente in sidebar, ma uno strumento che fornisce agli agenti accesso autonomo a editor, terminale e browser. Gli agenti possono pianificare, eseguire e validare autonomamente task software complessi end-to-end.

Gemini 3 verso il world model

Gemini 3 Pro è un modello solido per l’uso quotidiano, che potrebbe rubare quote di mercato a ChatGPT: è molto veloce, con forti capacità generative di ragionamento e visive. Come dichiarato da Demis Hassabis e Koray Kavukcuoglu: con Gemini 1 si è introdotta la multimodalità, con Gemini 2 il ragionamento e le capacità agentive iniziali, con Gemini 3 si completa l’integrazione di tutte queste funzionalità.
Di più, questo modello va considerato come la base per lo sviluppo in ottica agentiva dei chatbot che, nei prossimi mesi, saranno in grado non solo di darci risposte, ma di portare a termini compiti complessi, interpretando attivamente il mondo circostante (ecco perché si parla di “world model”).

✉️ Ti è piaciuto questo articolo? Iscriviti alla mia newsletter gratuita!
Leave a comment

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito utilizza Akismet per ridurre lo spam. Scopri come vengono elaborati i dati derivati dai commenti.