Mistral è una startup francese che, grazie al supporto di Macron e a finanziatori privati (tra cui Microsoft), vuole tracciare una via europea all’intelligenza artificiale. Per farlo, ha sviluppato una serie di Large Language Model addestrati anche su lingue europee come il francese, l’italiano, il tedesco e lo spagnolo (i modelli statunitensi come GPT, per l’addestramento, usano testi prevalentemente in inglese. In GPT-3 le parole italiane apprese corrispondevano allo 0,6% di tutte le altre).
Inizialmente Mistral ha rilasciato i suoi primi due modelli, Mistral 7B e Mixtral 8x7B, in modalità open source. Ma il 26 febbraio ha deciso di cambiare strategia, affiancando ad essi anche il modello Mistral Large, in modalità commerciale. Large è il modello più avanzato che sembra di poco sotto GPT-4, in termini di capacità di comprensione del linguaggio.
Large può essere usato via API, attraverso Microsoft Azure o istallato sui propri server. Inoltre, si può liberamente testare anche attraverso un’interfaccia web, chiamata Mistral Le Chat.
Una caratteristica importante è la possibilità di gestire fino a 32K token (mentre GPT-4 ha 8.192 token). Ma Mistral Large ha anche parecchi limiti: un dataset fermo al 2021, nessun accesso al web, né la possibilità di gestire allegati.
Nel video in basso, ho messo alla prova Mistral Le Chat con test di ragionamento, scrittura e marketing. Buona visione!