talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

L’apport d’une approche hybride pour la reconnaissance des entités nommées en langue arabe

Inès Zribi, Souha Mezghani Hammami, Lamia Hadrich Belguith

Résumé : Dans cet article, nous proposons une méthode hybride pour la reconnaissance des entités nommées pour la langue arabe. Cette méthode profite, d’une part, des avantages de l’utilisation d’une méthode d’apprentissage pour extraire des règles permettant l’identification et la classification des entités nommées. D’autre part, elle repose sur un ensemble de règles extraites manuellement pour corriger et améliorer le résultat de la méthode d’apprentissage. Les résultats de l’évaluation de la méthode proposée sont encourageants. Nous avons obtenu un taux global de F-mesure égal à 79.24%.

Abstract : In this paper, we propose a hybrid method for Arabic named entities recognition. This method takes advantage of the use of a learning method to extract rules for the identification and classification of named entities. Moreover, it is based on a set of rules extracted manually to correct and improve the outcome of the learning method. The evaluation results are encouraging as we get an overall F-measure equal to 79.24%.

Mots clés : Traitement de la langue arabe, reconnaissance des entités nommées, méthode d’apprentissage

Keywords : Arabic language processing, named entity recognition, learning method