talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

LSE au DEFT 2018 : Classification de tweets basée sur les réseaux de neurones profonds

Antoine Sainson, Hugo Linsenmaier, Alexandre Majed, Xavier Cadet et Abdessalam Bouchekif

Résumé : Dans ce papier, nous décrivons les systèmes développés au LSE pour le DEFT 2018 sur les tâches 1 et 2 qui consistent à classifier des tweets. La première tâche consiste à déterminer si un message concerne les transports ou non. La deuxième, consiste à classifier les tweets selon leur polarité globale. Pour les deux tâches nous avons développé des systèmes basés sur des réseaux de neurones convolutifs (CNN) et récurrents (LSTM, BLSTM et GRU). Chaque mot d’un tweet donné est représenté par un vecteur dense appris à partir des données relativement proches de celles de la compétition. Le score final officiel est de 0.891 pour la tâche 1 et de 0.781 pour la tâche 2.

Mots clés : Analyse d’opinions, plongement de mots, réseaux de neurones profonds, classifica- tion thématique.