talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un cadre d’annotation pour la modelisation logique de l’argumentation politique

Cecilia Graiff

Résumé : Cet article présente un cadre destiné à la construction en cours d’un corpus multilingue annoté selon sa structure argumentative. Il s’inscrit dans un projet de thèse visant à modéliser les schémas argumentatifs dans des données politiques à l’aide des (grands) modèles de langue. Cette recherche poursuit deux objectifs principaux : (1) étudier l’argumentation en contexte multilingue, en prenant en compte les variations liées à la langue, au pays et à la culture ; et (2) établir un pont entre l’argumentation fondée sur la logique et le traitement automatique des langues, en intégrant des mécanismes de raisonnement logique dans la chaîne de traitement afin d’améliorer la généralisabilité des modèles. Un défi majeur réside dans le manque de jeux de données à la fois multilingues et annotés selon la structure logique des arguments. Pour y remédier, nous avons collecté des données multilingues et publié des expérimentations dans un cadre bilingue. Cet article introduit une stratégie d’annotation fondée sur la logique, basée sur le cadre d’argumentation ASPIC+ (Modgil & Prakken, 2014), ainsi que des expérimentations préliminaires utilisant des modèles de type Transformers.

Mots clés : Modèles de langue, modélisation logique de l’argumentation, transfert interlinguistique, argumentation politique