talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Nemesis, un système de reconnaissance incrémentielle des entités nommées pour le français

Nordine Fourour

Résumé : Cet article présente une étude des conflits engendrés par la reconnaissance des entités nommées (EN) pour le français, ainsi que quelques indices pour les résoudre. Cette reconnaissance est réalisée par le système Nemesis, dont les spécifications ont été élaborées conséquemment à une étude en corpus. Nemesis se base sur des règles de grammaire, exploite des lexiques spécialisés et comporte un module d’apprentissage. Les performances atteintes par Nemesis, sur les anthroponymes et les toponymes, sont de 90% pour le rappel et 95% pour la précision.

Abstract : This paper presents an investigation of the conflicts generated by the recognition of the French proper names (PN), and some indications to solve them. This recognition is carried out by the Nemesis system, whose specifications have been elaborated through corpus investigation. Nemesis is grammar-rule based, uses specialised lexicons, and includes a learning module. The system performance, evaluated on the categories composing the anthroponym and the toponym classes, achieves 95% precision and 90% recall.

Mots clés : Entités nommées, reconnaissance incrémentielle, apprentissage, surcomposition référentielle

Keywords : Name Entities, incremental recognition, learning processing, referential composition