talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Exploitation de lexiques pour la catégorisation fine d'émotions, de sentiments et d'opinions

Nicolas Hernandez, Grégoire Jadi, Joseph Lark, Laura Monceaux

Résumé : Nous présentons dans cet article notre proposition pour la 11ème édition du Défi Fouille de Textes (DEFT). Nous participons à trois tâches proposées dans le cadre de cet atelier en fouille d'opinion. Les objectifs de ces tâches sont de classer des tweets en français sur le sujet des énergies renouvelables, respectivement du point de vue de la polarité, du type général d'information énoncé, et enfin de la classe fine du sentiment, de l'émotion ou de l'opinion exprimée. Pour réaliser cette catégorisation, nous proposons d'explorer et d'évaluer différentes méthodes de construction de lexiques typés sémantiquement : outre des lexiques affectifs construits manuellement, nous expérimentons des lexiques typés construits semi-automatiquement sur le corpus d'évaluation et d'autres sur un corpus tiers.

Abstract : In this article, we present our contribution to the 11th DEFT workshop (Défi Fouille de Textes). We take part in three tasks proposed in this opinion mining challenge. The goal of these tasks is to analyse a corpus of french tweets about renewable energy, through the inference of their polarity, general semantic class, and fine-grained sentiment class respectively. Our proposition makes use of a machine learning process that combines various ways of building semantically classified lexicons. We explore the use of external lexicons, semi-supervisely extracted lexicons from the training corpus, and semi-supervisely extracted lexicons from a third-party corpus.

Mots clés : Fouille d'opinion, Expression d'émotions, Analyse de sentiments, Construction de lexique, Classification fine

Keywords : Sentiment analysis, Opinion mining, Fine-grained emotion classification, Lexicon acquisition