Résolution automatique d’anaphores infidèles en français : Quelles ressources pour quels apports ?
Susanne Salmon-Alt
Résumé : La performance d’une résolution automatique d’anaphores infidèles pour le français pourrait atteindre une F-mesure de 30%. Ce résultat repose toutefois sur une ressource équivalente à un bon dictionnaire de la langue française, une analyse syntaxique de qualité satisfaisante et un traitement performant des entités nommées. En l’absence de telles ressources, les meilleurs résultats plafonnent autour d’une F-mesure de 15%.
Abstract : A system for solving indirect anaphora in French seems to be able to achieve a F-measure of 30%. However, this result supposes a high quality lexical database (equivalent to a classical dictionary), a good parser and a high precision named entity recognition. In case such resources are not available, the best results are obtained by using simple heuristics and are limited to a F-measure of 15%.
Mots clés : anaphore infidèle, ressource sémantique, résolution d’anaphore, corpus annoté multiniveau
Keywords : indirect anaphor, lexical database, anaphora resolution, multi-level corpus annotation