talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Résoudre la coréférence à l’aide d’un classifieur bayésien naïf

Olivier Tardif

Résumé : Nous présentons ici les bases d’une méthode de résolution de la coréférence entre les expressions nominales désignant des entités nommées. Nous comptons appliquer cet algorithme sur un corpus de textes journalistiques ; certains aspects de ce que l’on pourrait nommer les « facteurs de coréférence » dans ces textes nous amènent à favoriser l’utilisation de méthodes statistiques pour accomplir cette tâche. Nous décrivons l’algorithme de résolution de la coréférence mis en oeuvre, constitué d’un classifieur bayésien naïf.

Abstract : In this paper we describe a coreference resolution algorithm for nominal expressions denoting named entities. The corpus used consists of French newspaper texts. In these texts, some properties of what we call “coreference factors” lead us to prefer a statistical approach for the task. We describe a coreference resolution algorithm consisting in the implementation of a naive Bayes classifier.

Mots clés : classifieur bayésien naïf, coréférence, entités nommées

Keywords : naive Bayes classifier, coreference, named entities