talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Résolution automatique d’anaphores infidèles en français : Quelles ressources pour quels apports ?

Susanne Salmon-Alt

Résumé : La performance d’une résolution automatique d’anaphores infidèles pour le français pourrait atteindre une F-mesure de 30%. Ce résultat repose toutefois sur une ressource équivalente à un bon dictionnaire de la langue française, une analyse syntaxique de qualité satisfaisante et un traitement performant des entités nommées. En l’absence de telles ressources, les meilleurs résultats plafonnent autour d’une F-mesure de 15%.

Abstract : A system for solving indirect anaphora in French seems to be able to achieve a F-measure of 30%. However, this result supposes a high quality lexical database (equivalent to a classical dictionary), a good parser and a high precision named entity recognition. In case such resources are not available, the best results are obtained by using simple heuristics and are limited to a F-measure of 15%.

Mots clés : anaphore infidèle, ressource sémantique, résolution d’anaphore, corpus annoté multiniveau

Keywords : indirect anaphor, lexical database, anaphora resolution, multi-level corpus annotation