talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

État de l’art : l’influence du domaine sur la classification de l’opinion, Dis-moi de quoi tu parles, je te dirai ce que tu penses

Morgane Marchand

Résumé : L’intérêt pour la fouille d’opinion s’est développé en même temps que se sont répandus les blogs, forums et autres plate-formes où les internautes peuvent librement exprimer leur opinion. La très grande quantité de données disponibles oblige à avoir recours à des traitements automatiques de fouille d’opinion. Cependant, la manière dont les gens expriment leur avis change selon ce dont ils parlent. Les distributions des mots utilisés sont différentes d’un domaine à l’autre. Aussi, il est très difficile d’obtenir un classifieur d’opinion fonctionnant sur tous les domaines. De plus, on ne peut appliquer sans adaptation sur un domaine cible un classifieur entraîné sur un domaine source différent. L’objet de cet article est de recenser les moyens de résoudre ce problème difficile.

Abstract : The interest in opinion mining has grown concurrently with blogs, forums, and others platforms where the internauts can freely write about their opinion on every topic. As the amounts of available data are increasingly huge, the use of automatic methods for opinion mining becomes imperative. However, sentiment is expressed differently in different domains : words distributions can indeed differ significantly. An effective global opinion classifier is therefore hard to develop. Moreover, a classifier trained on a source domain can’t be used without adaptation on a target domain. This article aims to describe the state-of-the-art methods used to solve this difficult task.

Mots clés : État de l’art, Fouille d’opinion, Multi-domaines, Cross-domaines

Keywords : State of the art, Opinion mining, Multi-domain, Cross-domain