talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Annotation de la continuité référentielle dans un corpus scolaire – premiers résultats

Martina Barletta

Résumé : La recherche Scolinter s’intéresse à l’étude des compétences en écriture des élèves de l’école primaire en France, en Italie et en Espagne. Le corpus éponyme se présente comme un large corpus longitudinal d’écrits d’élèves comparables dans les trois langues (Ponton et al., 2021). Il s’agit dans cette recherche de créer un outillage TAL applicable à ce type de corpus pour assister les chercheurs dans la description linguistique des phénomènes qui relèvent de la cohésion et de la cohérence textuelle, en particulier de la continuité référentielle. La première étape de cette recherche a consisté dans la conception d’un modèle et dans le choix d’un format d’annotation répondant à ces objectifs. Cette contribution fera tout d'abord un état des recherches sur l’annotation en anaphore, coréférence et continuité référentielle avant de présenter les spécificités du corpus Scolinter et de proposer des pistes méthodologiques pour la suite du travail.

Mots clés : corpus scolaires,TAL,continuité référentielle,annotation de corpus