talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Sélection globale de segments pour la reconnaissance d'entités nommées

Urchade Zaratiana, Niama El Khbir, Pierre Holat, Nadi Tomeh, Thierry Charnois

Résumé : La reconnaissance d'entités nommées est une tâche importante en traitement automatique du langage naturel avec des applications dans de nombreux domaines. Dans cet article, nous décrivons une nouvelle approche pour la reconnaissance d'entités nommées, dans laquelle nous produisons un ensemble de segmentations en maximisant un score global. Pendant l'entraînement, nous optimisons notre modèle en maximisant la probabilité de la segmentation correcte. Pendant l'inférence, nous utilisons la programmation dynamique pour sélectionner la meilleure segmentation avec une complexité linéaire. Nous prouvons que notre approche est supérieure aux modèles champs de Markov conditionnels et semi-CMC pour la reconnaissance d'entités nommées.

Mots clés : Reconaissance d'entités nommées, segmentation, Champ aléatoire conditionnel