Intégration des relations inter-référents dans l'annotation de la coréférence : modèle et application
Antoine Boiteau, Yann Mathet, Antoine Widlöcher
Résumé : La disponibilité de corpus annotés en coréférence demeure une nécessité pour de nombreux travaux en linguistique et en TAL. Toutefois, si de tels corpus sont bien disponibles, une part importante repose sur des modèles d'annotation ne permettant d'encoder qu'une partie des informations liées aux phénomènes coréférentiels. Après avoir redéfini un modèle élargi de la coréférence, nous montrerons les bénéfices d'une annotation menée à deux niveaux, celui de l'inscription des occurrences dans le texte (le repérage des maillons des chaînes de coréférence, niveau largement exploré) et celui des structures du modèle référentiel inféré (la clarification des rapports entre les entités désignées, domaine largement passé sous silence). Nous présenterons ensuite l'environnement OPERA destiné à l'annotation selon ce modèle repensé, et une campagne menée pour le tester.
Mots clés : Modélisation de la coréférence, campagne d'annotation, outil d'annotation.