talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Vers un système d'analyse syntaxique robuste pour l'Arabe

Chafik Aloulou, Lamia Hadrich Belguith, Abdelmajid Ben Hamadou

Résumé : Le degré de profondeur et de finesse de l'analyse syntaxique d'un texte écrit dépend énormément de l'objectif de l'analyse (analyse globale, analyse partielle, analyse détaillée, etc.) ainsi que du type d'application nécessitant cette analyse. Dans cet article, nous présentons une approche originale d'analyse syntaxique robuste appliquée à l'arabe et basée sur l'architecture multiagent. Comme première application de notre approche, notre système sera couplé avec un système de reconnaissance de l'écriture arabe dans le but d'effectuer, d'une part, la validation linguistique des mots reconnus par l'OCR (Optical Character Recognition) et d'autre part la détection et la correction des erreurs d'ordre lexicales, morphologiques, syntaxiques (cas des erreurs d'accord) et qui sont dues à la non ou au mal reconnaissance de certains mots par l'OCR. Le couplage de notre système avec le système de reconnaissance de l'écriture arabe entre dans le cadre d'un projet de coopération avec l'équipe Perception, Système et Information (PSI) de l'université de Rouen.

Mots clés : analyse syntaxique, analyse syntaxique robuste, langue, langue arabe, corpus, système de reconnaissance, système de reconnaissance de l'écriture arabe