talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Sentiment Detection Using PPM

Victoria Bobicev

Résumé : Cet article rend compte de notre travail dans le DEFT 2015, Défi Fouille de Texte. Le sujet de ce défi était la fouille d'opinion, l'analyse des sentiments et la détection de l'émotion dans les tweets écrits en français. La tâche a été résolue par un système qui utilise le PPM (Prédiction par correspondance partielle), algorithme de compression basé sur un modèle n-gram statistique. Nous avons présenté deux points : l'algorithme de PPMC basé sur des caractères avec et sans normalisation. Les résultats des expériences avec l'algorithme PPMC basé sur les caractères étaient meilleurs que pour les expériences avec l'algorithme basé sur les mots. La méthode de normalisation appliquée dans le processus de classification afin de surmonter l'imbalanceness des données n'était pas appropriée dans ces conditions et n'a pas aidé à améliorer les résultats.

Abstract : This paper reports on our work in the DEFT 2015 French Text Mining Challenge. The topic of this challenge was opinion mining, sentiment analysis and emotion detection in tweets written in French. The task was solved by a system that used the PPM (Prediction by Partial Matching) compression algorithm based on an n-gram statistical model. We submitted two runs; character-based PPMC algorithm with normalization and without. The results in the experiments on character based PPMC algorithm were better than word-based. The normalisation method applied in the process of classification in order to overcome the imbalanceness of the data was not appropriate in this case and did not help in improving the results.

Mots clés : Fouille d'opinion, Analyse de sentiments, Détection d'émotion, Prédiction par correspondance partielle

Keywords : Opinion Mining, Sentiment Analysis, Emotion Detection, Prediction by Partial Matching