talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un analyseur hybride pour la détection et la correction des erreurs cachées sémantiques en langue arabe

Chiraz Ben Othmane Zribi, Hanène Mejri, Mohamed Ben Ahmed

Résumé : Cet article s’intéresse au problème de la détection et de la correction des erreurs cachées sémantiques dans les textes arabes. Ce sont des erreurs orthographiques produisant des mots lexicalement valides mais invalides sémantiquement. Nous commençons par décrire le type d’erreur sémantique auquel nous nous intéressons. Nous exposons par la suite l’approche adoptée qui se base sur la combinaison de plusieurs méthodes, tout en décrivant chacune de ces méthodes. Puis, nous évoquons le contexte du travail qui nous a mené au choix de l’architecture multi-agent pour l’implémentation de notre système. Nous présentons et commentons vers la fin les résultats de l’évaluation dudit système.

Abstract : In this paper, we address the problem of detecting and correcting hidden semantic spelling errors in Arabic texts. Hidden semantic spelling errors are morphologically valid words causing invalid semantic irregularities. After the description of this type of errors, we propose and argue the combined method that we adopted in this work to realize a hybrid spell checker for detecting and correcting hidden spelling errors. Afterward, we present the context of this work and show the multi-agent architecture of our system. Finally, we expose and comment the obtained results.

Mots clés : erreur cachée, erreur sémantique, détection, correction, système multi-agent, langue arabe

Keywords : hidden error, semantic error, detection, correction, multi-agent system, Arabic language