talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Détection et résolution d’entités nommées dans des dépêches d’agence

Rosa Stern, Benoît Sagot

Résumé : Nous présentons NP, un système de reconnaissance d’entités nommées. Comprenant un module de résolution, il permet d’associer à chaque occurrence d’entité le référent qu’elle désigne parmi les entrées d’un référentiel dédié. NP apporte ainsi des informations pertinentes pour l’exploitation de l’extraction d’entités nommées en contexte applicatif. Ce système fait l’objet d’une évaluation grâce au développement d’un corpus annoté manuellement et adapté aux tâches de détection et de résolution.

Abstract : We introduce NP, a system for named entity recognition. It includes a resolution module for linking each entity occurrence to its matching entry in a dedicated reference base. NP thus brings information relevant for using named entity extraction in an applicative context. We have evaluated NP by the means of a manually annotated corpus designed for the tasks of recognition and resolution.

Mots clés : résolution d’entités nommées, détection d’entités nommées, extraction d’information

Keywords : named entity resolution, named entity recognition, information extraction