OpenAI ha rilasciato una nuova versione del suo modello linguistico di punta. GPT-5.5 è migliore nella capacità di scrittura, ha una spiccata capacità agentiva di seguire il nostro prompt ed è più efficiente (ha un uso più parsimonioso dei token). Ma cosa succede quando togliamo questo modello dalla vetrina e lo mettiamo a lavorare sui task complessi di chi fa marketing e sviluppo?
Il Ragionamento Esteso: Le Luci
La modalità “Thinking” è senza dubbio il fiore all’occhiello di questa versione. La vera differenza non sta tanto nella risposta finale, ma nel processo.
Affidare a GPT-5.5 un file CSV con i dati di decine di contenuti e campagne, e vederlo non solo restituire un report analitico, ma anticipare gli spunti più rilevanti mentre sta ancora calcolando, simula da vicino l’interazione con un data analyst senior. Nei miei test, il modello ha dimostrato una notevole capacità nel separare le “vanity metrics” dal vero valore di business, identificando immediatamente, gli insight nascosti in una valanga di dati.
Su task di pura logica e deduzione testuale, il salto in avanti rispetto a GPT-4 e alle versioni intermedie è tangibile.
Le ombre sul Coding
Ho chiesto al modello di creare dashboard interattive partendo dai dati analizzati e di ricostruire in codice una landing page sperimentale basata su WebGPU. I risultati? Funzionali, ma esteticamente acerbi. Testi sovrapposti, spaziature errate e un design che urla “Vanilla AI” da ogni pixel.
Anche sul fronte del coding, l’utilizzo dell’agente specializzato Codex (impostato sul livello di intelligenza massima) per creare una mappa interattiva con OpenStreetMap ha generato codice buggato, richiedendo molteplici correzioni. Curiosamente, la semplice interfaccia di ChatGPT con la modalità Thinking estesa ha portato a risultati migliori in minor tempo.
Ovviamente, queste sono solo alcune prove. Continuerò a farne perché i nuovi modelli richiedono nuove pratiche e adattamento anche da parte degli umani.
