talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Annotation et modélisation des émotions dans un corpus textuel : une approche évaluative

Jonas Noblet

Résumé : L'émotion est un phénomène capital dans le fonctionnement de l'être humain en société. Elle reste pourtant un sujet encore largement ouvert, notamment dans ses manifestations textuelles. La présente communication examine un corpus industriel manuellement annoté selon une approche évaluative de l'émotion. Cette conception théorique aujourd'hui peu exploitée propose une perspective différente, en complément des approches traditionnelles. Partant du constat que les annotations que nous avons collectées présentent un fort désaccord, nous avons émis l'hypothèse que celles-ci suivent néanmoins des tendances statistiques stables. Par le biais de modèles de langue entraînés sur ces annotations, nous montrons qu'il est possible de modéliser le processus d'étiquetage, et que la variabilité est guidée par des caractéristiques linguistiques sous-jacentes. Réciproquement, nos résultats indiquent que les modèles de langue semblent en mesure de distinguer les situations émotionnelles sur la base des critères évaluatifs.

Mots clés : Annotation, Émotion, Accord inter-juges, Modèles de langue.