ChatGPT: test del nuovo o3-mini

OpenAI ha rilasciato o3-mini, un nuovo modello di “reasoning” che segue il precedente o1. Questi modelli, a differenza di GPT-4o, sono progettati per affrontare compiti complessi, con particolare attenzione alle discipline STEM (scienza, tecnologia, ingegneria e matematica) e alla programmazione.

Versioni e disponibilità di o3-mini

o3-mini è stato reso disponibile immediatamente sia agli utenti paganti che a quelli che non hanno un abbonamento, forse in risposta al rilascio gratuito del modello R1 da parte del competitor DeepSeek. Ma i non paganti potranno usare solo la versione più limitata del modello o1 che arriva in diverse taglie:

o3-mini low: fornisce risposte veloci ma meno precise. È disponibile per gli utenti free;
o3-mini medium: bilancia accuratezza e velocità. È quello di default per gli utenti Plus, Teams e Pro. Per gli utenti Plus e Teams c’è un limite di 150 richieste al giorno;
o3-mini high: fornisce risposte più precise e approfondite, ma richiede più tempo e risorse computazionali. Per gli utenti Plus e Teams c’è un limite di 50 richieste a settimana. Senza limiti per i Pro.

Agli sviluppatori viene data la possibilità di scegliere il livello di “reasoning effort” in base alle specifiche esigenze.

Le valutazioni condotte da esperti hanno dimostrato che o3-mini produce risposte più accurate e chiare, con capacità di reasoning superiori rispetto a o1-mini. I tester hanno preferito le risposte di o3-mini rispetto a quelle di o1-mini nel 56% dei casi e hanno osservato una riduzione del 39% degli errori gravi su domande reali e complesse. Con un livello di reasoning medio, o3-mini eguaglia le prestazioni di o1 in alcune delle valutazioni di reasoning e intelligenza più impegnative, tra cui AIME e GPQA.

Nel mio video ho testato o3-mini su domande di logica. Buona visione.