talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Détection de polarité d’opinions dans les forums en langue arabe par fusion de plusieurs SVM

Amel Ziani, Nabiha Azizi, Yamina Tlili-Guiassa

Résumé : Cet article décrit notre contribution sur la détection de polarité d’opinions en langue arabe par apprentissage supervisé. En effet le système proposé comprend trois phases: le prétraitement du corpus, l’extraction des caractéristiques et la classification. Pour la deuxième phase, nous utilisons vingt caractéristiques dont les principales sont l’émotivité, la réflexivité, l’adressage et la polarité. La phase de classification représente dans notre travail la combinaison des plusieurs classifieurs SVMs (Machine à Vecteur de Support) pour résoudre le problème multi classes. Nous avons donc analysés les deux stratégies de SVM multi classes qui sont : « un contre tous » et « un contre un » afin de comparer les résultats et améliorer la performance du système global.

Abstract : This article describes our contribution on the polarity’s detection of opinions in Arabian language by supervised training. Indeed the proposed system consists of three phases: the pretreatment of the corpus, the extraction of the features and the classification. For the second phase, we use twenty features of which the main are emotionalism, the reflexivity, the adressage and the polarity. The phase of classification represents in our work the combination of the several SVMs (Support Vector Machine),to solve the multi class problem. We analyzed the two strategies of the SVMs multi class that are: "one against all" and "one against one" in order to compare the results and to improve the performance of the global system.

Mots clés : Fouille d’opinions, apprentissage supervisé, Machine à Vecteur de Support (SVM), combinaison des classifieurs

Keywords : Opinion Mining, supervised training, Support Vector Machine (SVM), classifiers combination