talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

RENAM: Système de Reconnaissance des Entités Nommées Amazighes

Meryem Talha, Siham Boulaknadel, Driss Aboutajdine

Résumé : La reconnaissance des Entités Nommées (REN) en langue amazighe est un prétraitement potentiellement utile pour de nombreuses applications du traitement de la langue amazighe. Cette tâche représente toutefois un sévère challenge, compte tenu des particularités de cette langue. Dans cet article, nous présentons le premier système d’extraction d’entités nommées amazighes (RENAM) fondé sur une approche symbolique qui utilise le principe de transducteur à états finis disponible sous la plateforme GATE.

Abstract : Named Entity Recognition (NER) for Amazigh language is a potentially useful pretreatment for many processing applications for the Amazigh language. However, this task represents a tough challenge, given the specificities of this language. In this paper, we present (NERAM) the first named entity system for the Amazigh language based on a symbolic approach that uses linguistic rules built manually by using an information extraction tool available within the platform GATE.

Mots clés : Reconnaissance des entités nommées (REN), Langue Amazighe, Règles d’annotation, JAPE, GATE

Keywords : Named Entities Recognition (NER), Amazigh Language, Annotation Rules, JAPE, GATE