Vincos – il blog di Vincenzo Cosenza

Referendum 2016: data mining delle conversazioni sul web

Negli ultimi due mesi il referendum sulla proposta di riforma della Costituzione ha catalizzato l’attenzione degli italiani fino al risultato finale, che ha visto prevare il NO (59,11%) sul SI (40,89%). Grazie alle tecnologie di Blogmeter ho seguito l’evoluzione quantitativa e qualitativa delle conversazioni in rete fino ad individuare le percentuali di persone che si sono espresse su entrambe le posizioni. Queste, già tre giorni prima del voto, sono risultate essere straordinariamente vicine al risultato finale (come dimostra il nostro comunicato rilanciato da ANSA).

L’analisi
Dal 24 settembre al 4 dicembre, ho raccolto oltre 4,5 milioni di messaggi pubblici sul tema referendum, lasciati da più di 920.000 utenti, che hanno generato 29 milioni di interazioni sui social media (like, retweet, commenti, visualizzazioni, ecc…) e 375 milioni di visualizzazioni.
Si è trattato di un’analisi che ha riguardato tutto l’open web e non solo Twitter, come spesso si vede fare in giro.

In particolare il 54% di questi messaggi è stato prodotto su Twitter, il 36% su Facebook, il 6% dai siti di notizie e il restante su altre piattaforme. Se invece si guarda alle interazioni generate si scopre che ben il 75% di esse è avvenuto su Facebook, il 11% su Twitter, il 9% su YouTube, il 5% su Instagram.

Le espressioni di voto
Grazie alle nostre tecnologie di analisi semantica, anziché concentrarmi unicamente sulla quantità di messaggi a favore di una tesi e dell’altra, ho considerato gli autori unici. In questo modo ho evitato di contare più volte coloro che nel periodo hanno pubblicato più messaggi contenenti la medesima volontà elettorale.
Di conseguenza ho individuato ben 500.000 italiani che, in oltre 2,2 milioni di messaggi, hanno espresso una opinione chiara. Di questi il 60% ha pubblicato commenti a favore del NO mentre il 40% lo ha fatto per il SI.

Il risultato ci porta a riflettere su come il web sia diventato uno specchio abbastanza fedele delle dinamiche della società e sul fatto che un’analisi metodologicamente accurata dei messaggi pubblicati su tutto il web può offrire informazioni precise sulle opinioni delle persone, anche in campo politico.

Le conversazioni
L’analisi sematica ha permesso di comprendere le differenti argomentazioni esposte dalle due fazioni.
I concetti più ricorrenti nei messaggi dei sostenitori del NO sono risultati essere l’opportunità di mandare a casa Renzi e la questione dell’immunità parlamentare per i consiglieri regionali. Gli hashtag e i termini più citati sono stati: “#iovotono”, “votare” e “renzi”.
I favorevoli alla riforma, invece, hanno concentrato l’attenzione sulla riduzione dei costi della politica e sui benefici derivanti dall’abolizione del bicameralismo paritario. Gli hashtag e i termini più usati sono stati “#bastunsi”, “votare” e “vincere”.

I post con più interazioni
L’analisi dei contenuti più virali in rete evidenzia la rilevanza dei video. Su Facebook hanno avuto successo quelli promossi dai partiti e dai politici. In particolare quello del Movimento 5 Stelle che mostra la manifestazione per il NO a Roma (oltre 2,4 milioni di visualizzazioni) e lo spot “Si riparte” pubblicato da Matteo Renzi (oltre 2 milioni di visualizzazioni).
Su YouTube, ambiente preferito dai più giovani, emergono quelli “non ufficiali” di stampo divulgativo e umoristico. Esempio del primo tipo è “Il referendum costituzionale riassunto e spiegato semplicemente” dello youtuber Alessandro Masala, che ha generato oltre 450.000 visualizzazioni. Tra i secondi si segnala “Referendum 2016 Hai notato che…” di Daniele Doesn’t Matter con oltre 150.000 visualizzazioni.

Topologia delle reti
Analizzando le citazioni su Twitter attraverso la tecnica della Social Network Analysis è possibile visualizzare la conformazione delle reti di account espressisi sull’argomento. Nell’immagine seguente i nomi più grandi (nodi) sono quelli più citati nel periodo analizzato (28/11-3/12), mentre le linee di collegamento (archi) denotano un’avvenuta citazione (reply e retweet). Il colore verde identifica le citazioni che originano da account per il SI, mentre il rosso indica quelle che originano da i sostenitori del NO.
Quello che emerge è una sostanziale polarizzazione delle posizioni, con reti del NO nettamente distanti da quelle del SI. Ma i nodi più grandi, come Renzi, hanno molteplici citazioni in entrata, spesso denigratorie, provenienti anche dai suoi oppositori.

In conclusione ecco alcune cose che ho imparato e su cui varrebbe la pena riflettere insieme:

– analizzare solo Twitter è riduttivo e rischia di produrre una distorsione dei risultati. Meglio estendere il data mining a tutto l’open web;
– considerare sono la frequenza di utilizzo di termini e hashtag produce una sovrastima dei risultati. E’ fondamentale concentrare l’attenzione sugli autori unici;
– il contenuti più virali non sono state le “fake news” come qualcuno ha detto, ma i messaggi provenienti dai protagonisti del dibattito politico
– le conversazione sul web, se analizzate correttamente, posso essere un termometro attendibile delle opinioni politiche

Exit mobile version