I modelli linguistici di grandi dimensione hanno raggiunto capacità similari. Di conseguenza, la competizione tra le aziende si sposta sulla realizzazione di agenti. Ma la trasformazione formale dei chatbot in agenti completamente autonomi richiedere ancora tempo. Per il momento, quelli che stanno arrivando sul mercato sono agenti specifici, poco autonomi e molto limitati.
Il primo esempio che abbiamo visto è quello dell’agente in grado di compire ricerche sul web. Google ha battuto tutti sul tempo, proponendo il modello “Gemini with Deep Research” (dentro la versione a pagamento Gemini Advanced).
Poi è arrivata OpenAI che ha inserito la funzione Deep Research dentro ChatGPT, inizialmente solo nell’abbonamento Pro e ora anche in quello Plus (anche se qui c’è un limite attuale di 10 ricerche al mese).
Anche Perplexity ha inserito una funzione simile, ma non mi sembra all’altezza di queste due. Così ho deciso di fare un video per mettere alla prova le capacità Deep Research di Gemini e di ChatGPT sulle ricerche di mercato, le ricerche di prodotti/servizi e quelle su saggi scientifici.
In sintesi, quello che emerge è che, al momento, Gemini riesce a condurre ricerche su un maggior numero di siti (anche circa un migliaio) anche se il report finale risulta un po’ superficiale. ChatGPT, al contrario, fa ricerca solo su qualche decina di siti, ma le sue conclusioni sono più profonde. La differenza è dovuta al fatto che il chatbot di OpenAI, alla base, attiva il modello di reasoning o3 (che ancora non è stato rilasciato al pubblico), dunque durante le ricerche “ragiona” sui passi successivi da compiere.
Sono sicuro che anche Gemini introdurrà questo espediente e che tanti altri chatbot attiveranno una funzione di ricerca profonda. Questo è solo l’inizio del percorso di trasformazione dei chatbot in agenti autonomi.