talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Une étude des avis en ligne : généralisabilité d’un modèle d’évaluation

Hyun Jung Kang, Iris Eshkol-Taravella

Résumé : Ce travail se situe dans la continuité de nos travaux antérieurs proposant le modèle d’évaluation portant sur des avis en ligne sur des restaurants. Le modèle est composé de quatre catégories : l’opinion (positive, négative, mixte), la suggestion, l’intention et la description. Cet article vise à tester la généralisabilité du modèle en l’appliquant sur deux corpus supplémentaires : un corpus relevant d’un autre domaine (celui de l’hôtellerie) et un corpus écrit dans une autre langue (le coréen). Nous avons présenté l’annotation manuelle et la détection automatique de ces catégories en nous appuyant sur différents modèles de l’apprentissage de surface (SVM) et l’apprentissage profond (LSTM).

Mots clés : fouille d’opinion, avis en ligne, classification supervisée, généralisabilité, coréen.