Dopo una prima parte tesa ad analizzare la rete da un punto di vista più tradizionale, durante State of the Net, ho presentato un lavoro inedito delle conversazioni e degli umori degli italiani. Per la prima volta con il team di analisti e linguisti computazionali di Blogmeter ho studiato 31,5 milioni di tweet scritti dagli italiani e analizzati automaticamente dal nostro sistema [visualizzati da The Visual Agency].
Twitter inizia a svegliarsi già dalle 5 del mattino. La prima punta di tweet si ha tra le 12 e le 14, mentre la massima si riscontra tra le 19 e le 21. Il giorno preferito per twittare è il lunedì, mentre il sabato ci si riposa.
Il 28% dei tweet ha un link quindi contiene rimandi ad altri luoghi della rete, il resto è opinione. Il 18% rappresenta un retweet, quindi un’opinione altrui. Solo il 5% dei tweet è geolocalizzato. Il 23% contiene un hashtag.
Proprio l’analisi degli hashtag che spesso hanno la funzione di legare delle conversazioni, ci consente di capire di cosa parlano gli utenti attuali (che non sono più solo early adopter). I più utilizzati del periodo possono essere raggruppati in categorie (nell’immagine quelli che hanno fatto registrare i maggiori picchi):
– le pratiche sociali: #ff (che ogni venerdì si ritrova in oltre 18.000 tweet) #sapevatelo #rt #lol #fb
– la condivisione e il commento ai fatti di cronaca: su tutti #terremoto e poi #brindisi; ma anche #bologna #no2giugno #euro2012 #calcio #monti #bossi
– la visione collettiva di una trasmissione televisiva o radiofonica. Le più popolari sono state #amici e #mistero, poi #serviziopubblico, #piazzapulita, #twitandshout
– i luoghi: #roma, #milano, #italia.
Ma le parole nascondono un mood (si parla di sentiment solo quando il campo semantico è definito): il software di analisi semantica di Blogmeter ha permesso di comprendere automaticamente la positività e la negatività di questi milioni di messaggi, ma soprattutto del cambiamento nel tempo delle attitudini emotive degli italiani. Poco più di 1/3 dei tweet analizzati contiene un’espressione emotiva. Se in una giornata tipo le emozioni positive e negative tendono ad equivalersi, in occasione di eventi particolari emergono dei picchi.
Dall’analisi del periodo considerato si notano due picchi di negatività (Bomba a Brindisi e Terremoto) e alcuni giorni in cui prevale la positività, ma non legata ad un singolo evento.
Durante le ore del dopo bomba emerge anzitutto il disgusto, seguito da tristezza, rabbia, paura. Mentre durante il terremoto in Emilia le emozioni si invertono ed emerge la paura in primis, seguita da disgusto e rabbia. Di diverso tenore la partita dell’Italia. Qui l’analisi granulare dei messaggi allo scorrere dei minuti mostra prima la rabbia, poi seguita dalla gioia.
Complimenti per il bel lavoro. Gli algoritmi di analisi semantica sono pubblici? Vi siete basati su qualche soluzione particolare?
Ciao,
Emanuele
grazie Emanuele, si gli algoritmi sono proprietari di Blogmeter che ha un suo motore di analisi semantica, che viene settato da linguisti computazionali.
Molto interessante tutta l’analisi, complimenti!
Hai dati aggiornati sulla partita Italia-Inghilterra?
pasquale
c’è stata meno rabbia e un maggiore picco di gioia rispetto alla precedente.
Mi ha chiarito dei concetti,allertato curiosità,e consigliato un nuovo approccio.Grazie.