talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Identifier les pronoms anaphoriques et trouver leurs antécédents : l’intérêt de la classification bayésienne

Davy Weissenbacher, Adeline Nazarenko

Résumé : On oppose souvent en TAL les systèmes à base de connaissances linguistiques et ceux qui reposent sur des indices de surface. Chaque approche a ses limites et ses avantages. Nous proposons dans cet article une nouvelle approche qui repose sur les réseaux bayésiens et qui permet de combiner au sein d’une même représentation ces deux types d’informations hétérogènes et complémentaires. Nous justifions l’intérêt de notre approche en comparant les performances du réseau bayésien à celles des systèmes de l’état de l’art, sur un problème difficile du TAL, celui de la résolution d’anaphore.

Abstract : In NLP, a traditional distinction opposes linguistically-based systems and knowledge-poor ones, which mainly rely on surface clues. Each approach has its drawbacks and its advantages. In this paper, we propose a new approach based on Bayes Networks that allows to combine both types of information. As a case study, we focus on the anaphora resolution which is known as a difficult NLP problem. We show that our bayesain system performs better than a state-of-the art one for this task.

Mots clés : réseaux bayésiens, résolution des anaphores, connaissance linguistique, indice de surface

Keywords : bayesian network, anaphora resolution, linguistic knowledge, surface clue