Vincos – il blog di Vincenzo Cosenza

Cos’è la Sentiment Analysis?

Spesso sento paragonare il web ad un enorme focus group. In verità è molto meglio di un focus group perché contiene opinioni espresse liberamente. Discorsi che, se ascoltati, possono essere di enorme valore per le aziende. Per far ciò bisogna avvalersi di software in grado di recuperare, comprendere e classificare i messaggi lasciati in rete. Due gli approcci possibili: machine learning e rule based.

Il primo fa uso di algoritmi di apprendimento in grado di estrarre informazioni utili da dati di dominio. Il secondo, che usiamo in BlogMeter, si basa sull’utilizzo di regole. Il processo di comprensione automatica si articola in tre fasi:

1. l’analisi di porzioni di testo come sintagmi (“con cura”, ”incazzato nero”, ”mancanza di rispetto”), espressioni multiparola (“fare acqua”, ”dalla padella alla brace”, ”parlare alle spalle”), parole singole (“gioire”), modi di dire (“toccare il cielo con un dito”) e indicatori testuali come la punteggiatura e l’ortografia;

2. l’estrazione del mood positivo e negativo dai messaggi (tecnicamente detti documenti) analizzati

3. la classificazione dei documenti secondo una polarità positiva, negativa o mixed. Al calcolo della polarità il motore semantico associa, inoltre, un punteggio che descrive l’intensità con cui l’opinione è espressa nel documento (High, Medium, Low).

Il processo di analisi automatica delle porzioni di testo sfrutta due principali risorse linguistiche:

sentiment lexicon cioè lessici ad ampia copertura di singole parole e multi word unit arricchiti con informazioni relative alla loro valenza positiva o negativa e all’emozione che trasmettono. Inoltre, sempre all’interno di questa risorsa vengono trattati gli annullamenti di polarità in contesti linguistici particolari (“piacere” in “per piacere”,”lordo” in “prodotto interno lordo” o “salario lordo”, “straordinario” in “riunione straordinaria” o “apertura straordinaria”, “mortale” in “salto mortale”,);

regole sintattico-semantiche per la composizione delle espressioni di sentiment (“il loro sporco profitto”, ”era una persona riprovevole”, ”la sua volgarissima esibizione di strafottenza”), per il trattamento di fenomeni linguistici come la negazione (“non mi sento bene”) e la quantificazione (“mi sento poco bene”), per l’identificazione di domande e comparazioni (“x è più bello di y”), per il cambiamento di polarità delle espressioni in determinati contesti (“aumento dei prezzi”, “diminuzione dei prezzi”), ecc.

Di questi temi abbiamo parlato con Maria Petrescu di Intervistato.com nell’intervista che segue. Qui la versione breve.

Exit mobile version