talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Étude et conception d'un correcteur orthographique pour la langue haoussa

Lawaly Salifou, Harouna Naroua

Résumé : Dans cet article, un correcteur d’orthographe a été conçu, développé et testé pour la langue haoussa qui est la deuxième langue la plus parlée en Afrique et ne disposant encore pas d’outils de traitement automatique. La présente étude est une contribution pour le traitement automatique de la langue haoussa. Nous avons mis en œuvre les techniques et méthodes prouvées pour d’autres langues afin de concevoir un correcteur orthographique pour le haoussa. Le correcteur conçu au bout de ce travail exploite pour l’essentiel le dictionnaire de Mijinguini et les caractéristiques de l’alphabet haoussa. Après un état des lieux sur la correction orthographique et l’informatisation du haoussa, nous avons opté pour les structures de données trie et table de hachage pour implanter le dictionnaire. La distance d’édition et les spécificités de l’alphabet haoussa ont été mises à profit pour traiter et corriger les erreurs d’orthographe. L’implémentation du correcteur orthographique a été faite sur un éditeur spécial développé à cet effet (LyTextEditor) mais aussi comme une extension (add-on) pour OpenOffice.org. Une comparaison a été faite sur les performances des deux structures de données utilisées.

Mots clés : Traitement automatique des langues, informatisation du haoussa, langues africaines, correcteur orthographique.