Impact de l’agglutination dans l’extraction de termes en arabe standard moderne
Wafa Neifar, Thierry Hamon, Pierre Zweigenbaum, Mariem Ellouze, Lamia Hadrich Belguith
Résumé : Nous présentons, dans cet article, une adaptation à l’arabe standard moderne d’un extracteur de termes pour le français et l’anglais. L’adaptation a d’abord consisté à décrire le processus d’extraction des termes de manière similaire à celui défini pour l’anglais et le français en prenant en compte certains particularités morpho-syntaxiques de la langue arabe. Puis, nous avons considéré le phénomène de l’agglutination de la langue arabe. L’évaluation a été réalisée sur un corpus de textes médicaux. Les résultats montrent que parmi 400 termes candidats maximaux analysés, 288 sont jugés corrects par rapport au domaine (72,1%). Les erreurs d’extraction sont dues à l’étiquetage morpho-syntaxique et à la non-voyellation des textes mais aussi à des phénomènes d’agglutination.
Mots clés : Terminologie,Extraction de termes,Langue Arabe,Agglutination,Textes médicaux