talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Résolution des références aux documents dans un corpus de dialogues humains

Andrei Popescu-Belis

Résumé : Cet article étudie la résolution des références à des entités lorsqu’une représentation informatique de ces entités est disponible. Nous nous intéressons à un corpus de dialogues entre humains, portant sur les grands titres de la presse francophone du jour, et proposons une méthode pour détecter et résoudre les références faites par les locuteurs aux articles des journaux. La détection des expressions nominales qui réfèrent à ces documents est réalisée grâce à une grammaire, alors que le problème de la détection des pronoms qui réfèrent aux documents est abordé par des moyens statistiques. La résolution de ces expressions, à savoir l’attribution des référents, fait quant à elle l’objet d’un algorithme inspiré de la résolution des coréférences. Ces propositions sont évaluées par le biais de mesures quantitatives spécifiques.

Abstract : This article studies the resolution of references to entities in cases when a computational representation of the entities is available. Our data is a corpus of human dialogues about the front pages of one or more daily francophone newspapers. The main goal is to propose a method for the detection and resolution of references made by speakers to newspaper articles. A grammar is used to detect the nominal expressions referring to documents, while statistical methods are used to detect the pronouns referring to documents. An algorithm inspired from coreference resolution is used to solve all these expressions, i.e. to find the documents and articles they refer to. Specific quantitative metrics are applied to evaluate these proposals.

Mots clés : résolution des références, dialogue humain, évaluation quantitative

Keywords : reference resolution, human dialogue, quantitative evaluation