talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Digraphie des langues ouest africaines : Latin2Ajami : un algorithme de translittération automatique

El hadji M. Fall, El hadji M. Nguer, Sokhna Bao Diop, Mouhamadou Khoule, Mathieu Mangeot, Mame T. Cisse

Résumé : Les langues nationales du Sénégal, comme celles des pays d’Afrique de l’ouest en général, sont écrites avec deux alphabets : l’alphabet latin et l’alphabet arabe complété appelé aussi alphabet Ajami. Cette digraphie a créé deux mondes qui s’ignorent mutuellement. En effet, l’alphabet Ajami est généralement utilisé par les populations issues des écoles coraniques, alors que l’alphabet latin est utilisé par les populations issues de l’école publique. Pour résoudre ce problème, il s’avère utile de mettre en place des outils de translittération entre ces deux écritures. Un travail préliminaire (Nguer, Bao-Diop, Fall, khoule, 2015) avait été effectué pour situer les problématiques, les défis et les perspectives. Ce présent travail, qui en fait suite, a pour objectif l’étude et la mise en place d’un algorithme de translittération du latin vers l’Ajami. Cet algorithme est complètement réalisé et testé sous Word à travers la macro Ajami70 avec des résultats très satisfaisants.

Mots clés : TALN, translittération, langues africaines, alphabet Ajami, alphabet latin.