talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Analyse d'opinions de tweets par réseaux de neurones convolutionnels

Jean-Marc Marty, Guillaume Wenzek, Eglantine Schmitt, Jocelyn Coulmance

Résumé : La tâche d'analyse d'opinions consiste à détecter la polarité d'un texte (du plus négatif au plus positif). Nous présentons dans cet article un réseau de neurones permettant de trier de manière faiblement supervisée un ensemble de tweets en trois catégories : négatif, neutre ou positif. L'architecture du modèle est celle d'un réseau convolutionnel à trois couches mises en parallèles où chaque couche détecte des caractéristiques différentes. Le réseau est alimenté par des vecteurs-mots appris sur un ensemble de corpus dont la Wikipédia française, sans nécessiter d'informations linguistiques. En comparant cette approche avec un ensemble de techniques classiques alimentées par des sacs de mots, nous obtenons des résultats en moyenne 25% supérieurs en macro-précision.

Abstract : Sentiment Analysis is a common task in natural language processing that aims to detect polarity of a text document (from the most negative to the most positive). We introduce in this article a neural network that classifies in a weakly supervised fashion a set of tweets in three classes : negative, neutral or positive. The architecture of the model is that of a convolutional neural network with three parallel layers where each layer detects distinct features. The network is fed with word embeddings learned on a set of corpus among which the French Wikipedia with few linguistic informations. This model achieves a macro-precision in average 25% higher than classical methods based on bag of words.

Mots clés : Analyse d'opinions, Réseaux de neurones convolutionnels, Twitter

Keywords : Sentiment Analysis, Convolutional Neural Network, Twitter