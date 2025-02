OpenAI ha rilasciato o3-mini, un nuovo modello di “reasoning” che segue il precedente o1. Questi modelli, a differenza di GPT-4o, sono progettati per affrontare compiti complessi, con particolare attenzione alle discipline STEM (scienza, tecnologia, ingegneria e matematica) e alla programmazione.

Versioni e disponibilità di o3-mini

o3-mini è stato reso disponibile immediatamente sia agli utenti paganti che a quelli che non hanno un abbonamento, forse in risposta al rilascio gratuito del modello R1 da parte del competitor DeepSeek. Ma i non paganti potranno usare solo la versione più limitata del modello o1 che arriva in diverse taglie:

o3-mini low : fornisce risposte veloci ma meno precise. È disponibile per gli utenti free;

: fornisce risposte veloci ma meno precise. È disponibile per gli utenti free; o3-mini medium : bilancia accuratezza e velocità. È quello di default per gli utenti Plus, Teams e Pro. Per gli utenti Plus e Teams c’è un limite di 150 richieste al giorno;

: bilancia accuratezza e velocità. È quello di default per gli utenti Plus, Teams e Pro. Per gli utenti Plus e Teams c’è un limite di 150 richieste al giorno; o3-mini high: fornisce risposte più precise e approfondite, ma richiede più tempo e risorse computazionali. Per gli utenti Plus e Teams c’è un limite di 50 richieste a settimana. Senza limiti per i Pro.

Agli sviluppatori viene data la possibilità di scegliere il livello di “reasoning effort” in base alle specifiche esigenze.

Le valutazioni condotte da esperti hanno dimostrato che o3-mini produce risposte più accurate e chiare, con capacità di reasoning superiori rispetto a o1-mini. I tester hanno preferito le risposte di o3-mini rispetto a quelle di o1-mini nel 56% dei casi e hanno osservato una riduzione del 39% degli errori gravi su domande reali e complesse. Con un livello di reasoning medio, o3-mini eguaglia le prestazioni di o1 in alcune delle valutazioni di reasoning e intelligenza più impegnative, tra cui AIME e GPQA.

Nel mio video ho testato o3-mini su domande di logica. Buona visione.

