talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Combiner lexique et régression logistique dans la classification d’avis laissés sur le Net : une étude de cas

Stefania Pecore, Jeanne Villaneau, Farida Said

Résumé : L’article compare deux approches en sac de mots pour classifier des avis laissés sur des sites internet de langue française. La première, sans lexique et uniquement statistique, repose sur la régression logistique. La seconde repose sur un lexique d’opinion qui réunit les mots issus de la régression logistique avec une liste de noms, adjectifs et verbes courants annotés manuellement. Les résultats montrent l’intérêt que présente la régression logistique pour enrichir un lexique d’opinion. Par ailleurs, l’analyse des résultats permet de conjecturer les pistes à privilégier pour pallier les insuffisances des approches en sac de mots, particulièrement l’étude de la négation.

Mots clés : analyse des opinions, analyse des sentiments, lexique d’opinion.