talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Apports des analyses syntaxiques pour la détection automatique de mentions dans un corpus de français oral

Loïc Grobol, Isabelle Tellier, Éric de La Clergerie, Marco Dinarelli, Frédéric Landragin

Résumé : Cet article présente trois expériences de détection de mentions dans un corpus de français oral : ANCOR. Ces expériences utilisent des outils préexistants d’analyse syntaxique du français et des méthodes issues de travaux sur la coréférence, les anaphores et la détection d’entités nommées. Bien que ces outils ne soient pas optimisés pour le traitement de l’oral, la qualité de la détection des mentions que nous obtenons est comparable à l’état de l’art des systèmes conçus pour l’écrit dans d’autres langues. Nous concluons en proposant des perspectives pour l’amélioration des résultats que nous obtenons et la construction d’un système end-to-end pour lequel nos expériences peuvent servir de base de travail.

Mots clés : corpus de dialogues, coréférence, détection de mentions, analyse syntaxique, chunks, apprentissage automatique.