talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Analyse d'opinion et langage figuratif dans des tweets : présentation et résultats du Défi Fouille de Textes DEFT2017

Farah Benamara, Cyril Grouin, Jihen Karoui, Véronique Moriceau, Isabelle Robba

Résumé : La détection automatique du langage figuratif dans les réseaux sociaux est un sujet de recherche extrêmement actif principalement en raison de son importance pour améliorer les performances des systèmes d’analyse d’opinions. Pour la première fois, l’édition 2017 du Défi Fouille de Texte (DEFT) s’intéresse à l’influence du langage figuratif (en particulier l’ironie, le sarcasme et l’humour) dans l’analyse d’opinions à partir de tweets en français. Trois tâches de niveaux de complexité croissants ont été proposées aux participants : (T1) déterminer la polarité globale des tweets non figuratifs, (T2) déterminer si un tweet contient ou non du langage figuratif, et (T3) déterminer la polarité globale des tweets figuratifs et non figuratifs. Douze équipes ont participé à ce défi. Les meilleurs résultats, en macro f-mesure, sont de 0,650 pour (T1), 0,783 pour (T2) et 0,594 pour (T3). Ces résultats montrent clairement que l’usage du langage figuratif complique considérablement l’analyse d’opinions.

Mots clés : Analyse d’opinions, langage figuratif, analyse de polarité.