Vincos – il blog di Vincenzo Cosenza

ChatGPT: test del nuovo o3-mini

o3-mini

OpenAI ha rilasciato o3-mini, un nuovo modello di “reasoning” che segue il precedente o1. Questi modelli, a differenza di GPT-4o, sono progettati per affrontare compiti complessi, con particolare attenzione alle discipline STEM (scienza, tecnologia, ingegneria e matematica) e alla programmazione.

Versioni e disponibilità di o3-mini

o3-mini è stato reso disponibile immediatamente sia agli utenti paganti che a quelli che non hanno un abbonamento, forse in risposta al rilascio gratuito del modello R1 da parte del competitor DeepSeek. Ma i non paganti potranno usare solo la versione più limitata del modello o1 che arriva in diverse taglie:

Agli sviluppatori viene data la possibilità di scegliere il livello di “reasoning effort” in base alle specifiche esigenze.

Le valutazioni condotte da esperti hanno dimostrato che o3-mini produce risposte più accurate e chiare, con capacità di reasoning superiori rispetto a o1-mini. I tester hanno preferito le risposte di o3-mini rispetto a quelle di o1-mini nel 56% dei casi e hanno osservato una riduzione del 39% degli errori gravi su domande reali e complesse. Con un livello di reasoning medio, o3-mini eguaglia le prestazioni di o1 in alcune delle valutazioni di reasoning e intelligenza più impegnative, tra cui AIME e GPQA.

Nel mio video ho testato o3-mini su domande di logica. Buona visione.

✨ Vuoi approfondire i temi dell’Intelligenza Artificiale Generativa? Scopri i miei corsi di formazione!
Exit mobile version