talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un traitement hybride du vague textuel : du système expert VAGO à son clone neuronal

Benjamin Icard, Vincent Claveau, Ghislain Atemezing, Paul Egré

Résumé : L'outil VAGO est un système expert de détection du vague lexical qui mesure aussi le degré de subjectivité du discours, ainsi que son niveau de détail. Dans cet article, nous construisons un clone neuronal de VAGO, fondé sur une architecture de type BERT, entraîné à partir des scores du VAGO symbolique sur un corpus de presse française (FreSaDa). L'analyse qualitative et quantitative montre la fidélité de la version neuronale. En exploitant des outils d'explicabilité (LIME), nous montrons ensuite l'intérêt de cette version neuronale d'une part pour l'enrichissement des lexiques de la version symbolique, et d'autre part pour la production de versions dans d'autres langues.

Mots clés : Vague, Subjectivité, Précision, Détail, Hybridation, Explicabilité