Test: Claude 3.5 Sonnet contro ChatGPT

La competizione tra i modelli linguistici di grandi dimensioni diventa sempre più intensa. Anthropic, azienda creata da Dario e Daniela Amodei, ha rilasciato la versione 3.5 del modello Claude Sonnet (che fa parte di una più grande famiglia di modelli che comprende Haiku e Opus, ancora alla versione 3). In rete, subito è cresciuto l’hype e molti si sono affrettati a dire che ormai Anthropic ha superato OpenAI.

Così, ho voluto mettere alla prova Claude 3.5 Sonnet e GPT 4o con svariati test, di logica, di scrittura, di creazione di immagini, di attività di marketing, di scrittura di codice e di visione (la capacità di comprendere immagini caricate). I risultati sono nel video in basso.

Due nuove funzioni, spiccano in questa versione di Claude 3.5 Sonnet: Artifacts e Projects. Artifacts, ancora sperimentale quindi va attivata, è utile nella fase di scrittura di codice. Quando chiediamo al sistema di produrre un’applicazione software, l’interfaccia cambia, lo schermo si divide in due e sulla parte destra viene mostrato proprio l'”artefatto” generato ossia l’applicazione funzionante. In questo modo è più facile testarla e modificarla.

Claude Projects, invece, è pensato per creare dei progetti da condividere con un team, in modalità privata. Permette di aggiungere documenti di vario tipo e di interrogare il chatbot sulla base di essi. Ad esempio, un’azienda potrebbe caricare le proprie guide di stile e chiedere al chatbot di scrivere documenti in linea con esse. Nel progetto si possono aggiungere anche delle “custom instructions” per indirizzare il comportamento del chatbot. Insomma, Claude Project è a metà strada tra un bot personalizzato (simile ai GPTs che si possono creare in ChatGPT) e un sistema RAG (Retrieval Augmented Generation).

✨ Vuoi approfondire i temi dell’Intelligenza Artificiale Generativa? Scopri i miei corsi di formazione!

Post simili: