Vincos – il blog di Vincenzo Cosenza

Intelligenza Artificiale Generativa: le applicazioni

C’è una nuova buzzword che sta galvanizzando l’attenzione della Silicon Valley “Generative AI”. Col termine Intelligenza Artificiale generativa ci si riferisce all’utilizzo di tecniche di machine learning e deep learning per generare contenuti nuovi sulla base di dati pregressi. In particolare, parliamo dell’utilizzo di modelli linguistici di grandi dimensioni (Large Language Models) che permettono di ottenere testi, immagini, video, codice inedito a partire da un input testuale.

Le fasi dell’IA Generativa

Si tratta di un campo non nuovo, ma che ha subìto un’accelerazione rapida in quest’ultimo anno. Il perché è presto detto: oggi abbiamo più dati che in passato, più potenza computazione e dei migliori algoritmi generativi. E siamo solo all’inizio: Sequoia Capital prevede un impatto economico di trilioni di dollari nei prossimi anni.

Fino al 2015 per permettere ad una macchina di comprendere il linguaggio si usavano modelli linguistici non molto ampi. Erano efficaci per compiti molto specifici come previsioni di eventi, individuazione di spam, traduzioni basilari. Ma nel 2017 arriva la svolta: un paper di Google Research introduce una nuova architettura di rete neurale chiamata “transformer”, in grado di generare modelli linguistici di qualità più elevata, impiegando meno tempo di addestramento. Inoltre questi transformer possono essere personalizzati facilmente per operare in domini specifici. Iniziano ad essere messi alla prova da aziende come Microsoft, Google, OpenAI e, così, nel 2020 si assiste al primo salto di specie: GPT-3 è il modello che funziona meglio per la creazione di testi.

Ma questi modelli sono difficili da far funzionare, richiedono architetture hardware complesse, GPU potenti per cui sono disponibili a poche aziende. Piano piano i costi iniziano a calare e, oggi, sono spuntati i primi software stand alone e web based che stanno aprendo le porte ai test di massa (vedi post sulla generazione di immagini da testo). DALL-E 2, rilasciato in beta a luglio, è usato da oltre 1,5 milioni di persone che producono più di 2 milioni di immagini al giorno. Midjourney, aperto prima al pubblico, ha più di 3 milioni di utenti.

La prossima fase sarà quella dell’integrazione di questi metodi di generazione all’interno di prodotti già ampiamente utilizzati dalle persone. Microsoft ha già annunciato che Dall-E si potrà usare dentro Bing e sono stati creati plugin per utilizzare Stable Diffusion nei prodotti Adobe.

I domini dell’IA Generativa

Vediamo quali sono i domini applicativi dell’intelligenza artificiale generativa, a che punto siamo e dove potremo arrivare.

Generative AI Timeline (Sequoia Capital)

Le applicazioni esistenti

I modelli linguistici di grandi dimensioni (LLM) stanno portando alla nascita di prodotti che possono diventare dei “co-piloti” dei professionisti in vari campi. Va precisato che, al momento, funzionano bene con la lingua inglese, ma presto arriverà l’estensione ad altre lingue.

La mappa composta da Sequoia raccoglie anche nomi di aziende che ancora non hanno realizzato un prodotti solidi. Per esempio nel campo della generazione di mondi e oggetti tridimensionali da testo, siamo ancora in uno stadio sperimentale.

✉️ Ti è piaciuto questo articolo? Iscriviti alla mia newsletter gratuita!
Exit mobile version