L’evoluzione dell’intelligenza artificiale sta compiendo un passo decisivo, transitando dai modelli di chat conversazionale ai veri e propri agenti autonomi. In questo scenario si colloca Gemini Spark, la nuova soluzione di Google sviluppata per gli utenti consumer. Non si tratta semplicemente di un assistente a cui porre domande, ma di un collaboratore digitale in grado di pianificare ed eseguire flussi di lavoro articolati in totale autonomia, direttamente nel cloud. Ancora la funzione è disponibile solo negli USA, ma io l’ho testata in anteprima durante il mio viaggio a Mountain View.
Come funziona Gemini Spark
Gemini Spark vive dentro l’applicazione di Gemini, in una sezione separata denominata tasks: un ecosistema interamente dedicato alle attività operative a lungo termine. Quando viene assegnato un obiettivo, l’agente non si limita a rispondere, ma elabora un piano d’azione dettagliato, suddiviso in fasi distinte, mostrando all’utente ogni singolo passaggio logico e gli strumenti utilizzati durante il processo.
Una delle caratteristiche più rilevanti è la gestione delle connected apps: l’agente è nativamente integrato con l’ecosistema di produttività di Google (come Gmail, Documenti, Drive e Calendario) e supporterà applicazioni di terze parte. In prospettiva, l’adozione del protocollo di contesto del modello (noto come MCP o Model Context Protocol) permetterà il collegamento a qualsiasi server remoto, espandendo esponenzialmente il raggio d’azione del sistema.
Gemini Spark si presenta come la risposta di Google a Claude Cowork di Anthropic, anche se qui l’esecuzione delle attività non è in locale (non richiede che il computer rimanga acceso), ma in cloud. Ecco cosa permette di fare in questa fase di beta:
- Automazione e gestione della produttività: la capacità di analizzare flussi informativi come la posta elettronica e le scadenze consente alla tecnologia di individuare priorità, inserire automaticamente eventi importanti in agenda ed elaborare bozze di risposta per le comunicazioni più urgenti. L’utente viene costantemente mantenuto nel ciclo decisionale (secondo l’approccio human-in-the-loop), approvando o modificando le azioni prima della loro effettiva esecuzione.
- Ricerca avanzata e sintesi di dati: lo strumento è in grado di scansionare il web secondo criteri temporali, filtri settoriali e fonti specifiche impostate dall’utente. Riesce così a elaborare report accurati, generare presentazioni grafiche essenziali e archiviare i file all’interno di cartelle organizzate in cloud.
- Creazione e memorizzazione di competenze (skills): come in Cowork anche qui l’agente può formalizzare una procedura appena eseguita e pacchettizzarla sotto forma di file .md. Queste istruzioni strutturate diventano abilità permanenti che il sistema può richiamare in qualsiasi momento per compiti analoghi.
- Programmazione ricorrente (schedule): ogni flusso di lavoro o competenza registrata può essere inserita all’interno di un calendario di pianificazione automatica. In questo modo è possibile stabilire routine periodiche (giornaliere, settimanali o mensili) per far eseguire compiti strategici in orari prestabiliti, garantendo un’operatività continua, ventiquattro ore su ventiquattro.
Nel video in basso vi mostro cosa è possibile fare concretamente al momento. Molto di più si potrà ottenere quando Google aprirà il sistema alla connessione con applicazioni di terze parti.
