talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un système Multi-Agent pour la détection et la correction des erreurs cachées en langue Arabe

Chiraz Ben Othmane Zribi, Fériel Ben Fraj, Mohamed Ben Ahmed

Résumé : Cet article s’intéresse au problème des erreurs orthographiques produisant des mots lexicalement corrects dans des textes en langue arabe. Après la description de l’influence des spécificités de la langue arabe sur l’augmentation du risque de commettre ces fautes cachées, nous proposons une classification hiérarchique de ces erreurs en deux grandes catégories ; à savoir syntaxique et sémantique. Nous présentons, également, l’architecture multi-agent que nous avons adoptée pour la détection et la correction des erreurs cachées en textes arabes. Nous examinons alors, les comportements sociaux des agents au sein de leurs organisations respectives et de leur environnement. Nous exposons vers la fin la mise en place et l’évaluation du système réalisé.

Abstract : In this paper, we address the problem of detecting and correcting hidden spelling errors in Arabic texts. Hidden spelling errors are morphologically valid words and therefore they cannot be detected or corrected by conventional spell checking programs. In the work presented here, we investigate this kind of errors as they relate to the Arabic language. We start by proposing a classification of these errors in two main categories: syntactic and semantic, then we present our multi-agent system for hidden spelling errors detection and correction. The multi-agent architecture is justified by the need for collaboration, parallelism and competition, in addition to the need for information exchange between the different analysis phases. Finally, we describe the testing framework used to evaluate the system implemented.

Mots clés : Erreurs orthographiques cachées, Détection, Correction, Système multiagent, Analyse linguistique, Langue arabe

Keywords : Hidden spelling errors, Detection, Correction, Multi-Agent System, Linguistic analysis, Arabic language