talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Participation de l’IRISA à DeFT 2018 : classification et annotation d’opinion dans des tweets

Anne-Lyse Minard, Christian Raymond, Vincent Claveau

Résumé : Cet article décrit les systèmes développés par l’équipe LinkMedia de l’IRISA pour la campagne d’évaluation DeFT 2018 portant sur l’analyse d’opinion dans des tweets en français. L’équipe a participé à 3 des 4 tâches de la campagne : (i) classification des tweets selon s’ils concernent les transports ou non, (ii) classification des tweets selon leur polarité et (iii) annotation des marqueurs d’opinion et de l’objet à propos duquel est exprimée l’opinion. Nous avons utilisé un algorithme de boosting d’arbres de décision et des réseaux de neurones récurrents (RNN) pour traiter les tâches 1 et 2. Pour la tâche 3 nous avons expérimenté l’utilisation de réseaux de neurones récurrents associés à des CRF. Ces approches donnent des résultats proches, avec un léger avantage aux RNN, et ont permis d’être parmi les premiers classés pour chacune des tâches.

Mots clés : analyse d’opinion, boosting, arbres de décision, réseau de neurones récurrents, plongement de mots, CRF.