Analisi del sentiment

Da Wikipedia, l'enciclopedia libera.
Analisi del sentiment

L'Analisi del sentiment o Sentiment analysis (ma anche opinion mining) è la maniera a cui ci si riferisce all'uso dell'elaborazione del linguaggio naturale, analisi testuale e linguistica computazionale per identificare ed estrarre informazioni soggettive da diverse fonti. L'analisi del sentiment è ampiamente applicata per analizzare social media per una varietà di applicazioni, dal marketing al servizio clienti.

Metodi e caratteristiche[modifica | modifica wikitesto]

Gli approcci esistenti all'analisi del sentiment possono essere raggruppati in 4 categorie principali[1]:

  • Spotting di parole chiave
  • Affinità lessicale
  • Metodi statistici
  • Tecniche di livello concettuale

La prima classifica il testo da categorie influenti basata sulla presenza di parole influenti ambigue come contento, triste, impaurito, annoiato[2]. L'affinità lessicale non rileva solamente le parole influenzanti, ma anche assegna arbitrariamente alle parole una probabile affinità a emozioni particolari[3]. I metodi statistici fanno leva invece su elementi tratti dal machine learning come analisi semantica latente, macchine a vettori di supporto, bag of words e orientazione semantica[4]. Per estrapolare l'opinione in un contesto e ottenerne delle caratteristiche, sono usate le relazioni grammaticali delle parole. Le relazioni sono ottenute da un'analisi sintattica profonda del testo[5]. A differenza delle tecniche puramente sintattiche, gli approcci a livello concettuale fanno leva sugli elementi della rappresentazione della conoscenza come le ontologie e le reti semantiche, e quindi, sono capaci di rilevare semantiche che sono espresse in maniera sottile[6].

Sentiment analysis e Web 2.0[modifica | modifica wikitesto]

Risorse di analisi del sentiment[modifica | modifica wikitesto]

Vocabolari sentiment e parole:

Analizzatori di sentiment:

  • AlchemyAPI[15] (commercial)
  • BitextAPI[16] (commercial)
  • Semantria[17] (commercial)
  • Sentiment140[18] (commercial, for Twitter)
  • Stanford NLP[19] (academic)
  • Twinword[20] (commercial, free / unlimited)
  • Werfamous[21] (free)
  • WordStat[22] (commercial)
  • Buzzlogix[23] (free and commercial versions)

Documenti con annotazioni manuali di sentiment che possono essere usati per valutare gli algoritmi):

  • Twitter dataset in 4 languages[24] (12,500 tweet)

Note[modifica | modifica wikitesto]

  1. ^ Erik Cambria, Björn Schuller, Yunqing Xia e Catherine Havasi, New Avenues in Opinion Mining and Sentiment Analysis, in IEEE Intelligent Systems, vol. 28, nº 2, 2013, pp. 15–21, DOI:10.1109/MIS.2013.30.
  2. ^ Andrew Ortony, G Clore e A Collins, The Cognitive Structure of Emotions (PDF), Cambridge Univ. Press, 1988.
  3. ^ Ryan Stevenson, Joseph Mikels e Thomas James, Characterization of the Affective Norms for English Words by Discrete Emotional Categories (PDF), in Behavior Research Methods, vol. 39, nº 4, 2007, pp. 1020–1024.
  4. ^ Peter Turney, Thumbs Up or Thumbs Down? Semantic Orientation Applied to Unsupervised Classification of Reviews, in Proceedings of the Association for Computational Linguistics, 2002, pp. 417–424, arXiv:cs.LG/0212032.
  5. ^ Lipika Dey e S. K. Mirajul Haque, Opinion Mining from Noisy Text Data, in Proceedings of the second workshop on Analytics for noisy unstructured text data, p.83-90, 2008.
  6. ^ Erik Cambria e Amir Hussain, Sentic Computing: Techniques, Tools, and Applications (PDF), Springer, 2012.
  7. ^ generating the Affective Norms for English Words (ANEW) dataset, su tomlee.wtf.
  8. ^ Ryan A. Stevenson, Joseph A. Mikels e Thomas W. James, Characterization of the Affective Norms for English Words by discrete emotional categories, in Behavior Research Methods, vol. 39, nº 4, 1º novembre 2007, pp. 1020–1024, DOI:10.3758/BF03192999, ISSN 1554-351X.
  9. ^ a b SenticNet, su sentic.net.
  10. ^ Erik Cambria, Daniel Olsher e Dheeraj Rajagopal, SenticNet 3: A common and common-sense knowledge base for cognition-driven sentiment analysis (PDF), in Proceedings of AAAI, 2014, pp. 1515–1521.
  11. ^ Stefano Baccianella, Andrea Esuli e Fabrizio Sebastiani, Sentiwordnet 3.0: An enhanced lexical resource for sentiment analysis and opinion mining (PDF), in Proceedings of LREC, 2010, pp. 2200–2204. URL consultato il 5 aprile 2014.
  12. ^ SentiWordNet, su cnr.it.
  13. ^ Carlo Strapparava e Alessandro Valitutti, WordNet-Affect: An affective extension of WordNet (PDF), in Proceedings of LREC, 2004, pp. 1083–1086.
  14. ^ Manuela Speranza, FBK, WordNet Domains, su fbk.eu.
  15. ^ http://www.alchemyapi.com/
  16. ^ https://www.bitext.com/
  17. ^ Semantria Web Demo - semantria.com, su semantria.com.
  18. ^ API - Sentiment140 - A Twitter Sentiment Analysis Tool, su sentiment140.com.
  19. ^ Recursive Deep Models for Semantic Compositionality Over a Sentiment Treebank, su Deeply Moving: Deep Learning for Sentiment Analysis.
  20. ^ Twinword Sentiment Analysis API Web Demo, su twinword.com.
  21. ^ A Twitter and web sentiment analysis tool, su werfamous.com.
  22. ^ Content analysis software for sentiment analysis, su provalisresearch.com.
  23. ^ (EN) Text Analysis & Sentiment Analysis API | Buzzlogix, su Buzzlogix | Text Analysis API, Buzzlogix.com. URL consultato il 23 novembre 2015.
  24. ^ DAI-Labor > Competence Centers > CC IRML > Datasets > Annotated Sentiment Dataset, su dai-labor.de.

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]