talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

iBaatukaay : un projet de base lexicale multilingue contributive sur le web à structure pivot pour les langues africaines notamment sénégalaises

Mouhamadou Khoule, Mathieu Mangeot, El hadji Mamadou Nguer, Mame Thierno Cisse

Résumé : En général les langues africaines sont des langues peu dotées. La plupart des ressources existantes sont sous format papier. Il y a une rareté d'outils informatiques pour ces langues. C’est pour apporter des solutions à ces problèmes que le projet iBaatukaay est lancé. Son objectif est de mettre en place une base lexicale multilingue contributive sur le web pour les langues africaines notamment sénégalaises (wolof, pulaar, bambara, etc.). Le projet doit être une base pour la constitution de correcteurs orthographiques, de traducteurs automatiques et autres dictionnaires électroniques. iBaatukaay se veut utile et ouvert à la collaboration de toutes les personnes ayant un intérêt pour les langues concernées et les données produites seront téléchargeables gratuitement sous licence Creative Commons.

Mots clés : base lexicale multilingue, langues africaines, Sénégal, architecture pivot, iBaatukaay, jibiki, XML, wolof, pulaar, bambara, français.