talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Impact du Prétraitement Linguistique sur l'Analyse de Sentiment du Dialecte Tunisien

Chedi Bechikh Ali, Hala Mulki, Hatem Haddad

Résumé : Ce travail présente une étude de l’impact du prétraitement linguistique (suppression de mots vides,racinisation et détection d’emoji, de négation et d’entités nommées) sur la classification des sentimentsen dialecte Tunisien. Nous évaluons cet impact sur trois corpus de tailles et contenus différents. Deuxtechniques de classification sont utilisées : Naïve bayes et Support Vector Machines. Nous comparonsnos résultats aux résultats de référence obtenus sur ces même corpus. Nos résultats soulignent l’impactpositif de la phase de prétraitement sur la performance de la classification.

Mots clés : Analyse de sentiment, dialecte tunisien, prétraitement de texte, entités nommées.