A soli trenta giorni dall’ultimo rilascio, OpenAI ha sorpreso tutti con il lancio di GPT-5.2. Una mossa chiaramente “difensiva”, dettata dalla pressione di una concorrenza sempre più agguerrita, con Google Gemini 3 che ha dimostrato capacità eccezionali. Ma quanto è davvero “più intelligente” questa nuova versione? Nel mio ultimo video ho messo GPT-5.2 alla prova in scenari reali, passando dai benchmark teorici ai test di logica, creatività e marketing.
Sulla carta: un balzo nei ragionamenti astratti
I dati ufficiali sono notevoli. Il salto più grande si registra nel benchmark ARC-AGI 2 (ragionamento astratto), dove il modello passa dal 17,6% della versione 5.1 al 52,9%. Migliorano anche la capacità di visione, la memoria a lungo termine e si riducono le allucinazioni del 30%.
La prova sul campo: luci e ombre
Nonostante i numeri, le mie prove, ovviamente parziali, raccontano una storia più sfaccettata. Nel video vedremo insieme:
- Il fallimento sull’ironia: GPT-5.2 fatica ancora a cogliere il senso dell’umorismo più sottile, dove i competitor sembrano aver già ingranato la marcia giusta.
- Il paradosso del “pensiero esteso”: incredibilmente, il modello ha superato test di logica complessi in modalità standard, mentre si è “impallato” o ha fallito utilizzando la funzione di Extended Thinking. Più tempo per pensare non sempre significa una risposta migliore.
- Coding e Marketing: qui GPT-5.2 brilla. Ho testato la creazione di una dashboard Excel complessa e lo sviluppo di un gioco interattivo sul customer journey: i risultati sono stati rapidi e professionali, confermando l’ottima direzione presa sul fronte della produttività pura.
- Creatività e Copywriting: i suggerimenti di naming per un prodotto AI destinato agli avvocati sono apparsi piuttosto piatti. Su questo fronte, Claude e Gemini sembrano avere ancora un tocco più umano e brillante.
GPT-5.2 è un aggiornamento solido, un passo avanti necessario, ma manca ancora quell’effetto “wow” che avevamo sperato. È un modello più affidabile per il lavoro quotidiano, ma che soffre ancora di una certa lentezza e instabilità quando lo si spinge al massimo delle sue capacità di ragionamento. Ti lascio al video completo.





