talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Mesure non-supervisée du degré d'appartenance d'une entité à un type

Ludovic Bonnefoy, Patrice Bellot, Michel Benoit

Résumé : La recherche d'entités nommées a été le sujet de nombreux travaux. Cependant, la construction des ressources nécessaires à de tels systèmes reste un problème majeur. Dans ce papier, nous proposons une méthode complémentaire aux outils capables de reconnaître des entités de types larges, dont l'objectif est de déterminer si une entité est d'un type donné, et ce de manière non-supervisée et quel que soit le type. Nous proposons pour cela une approche basée sur la comparaison de modèles de langage estimés à partir du Web. L'intérêt de notre approche est validé par une évaluation sur 100 entités et 273 types différents.

Abstract : Searching for named entities has been the subject of many researches. In this paper, we seek to determine whether a named entity is of a given type and in what extent it is. We propose to address this issue by an unsupervised Web oriented language modeling approach. The interest of it is demonstrated by our evaluation on 100 entities and 273 different types.

Mots clés : typage d'entités nommées, comparaison de distribution de mots, divergence de Kullback-Leibler

Keywords : named entity identification, language modeling approach, Kullback-Leibler divergence