talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Translittération automatique pour une paire de langues peu dotée

Ngoc Tan Le, Fatiha Sadat, Lucie Ménard

Résumé : La translittération convertit phonétiquement les mots dans une langue source (i.e. français) en mots équivalents dans une langue cible (i.e. vietnamien). Cette conversion nécessite un nombre considérable de règles définies par les experts linguistes pour déterminer comment les phonèmes sont alignés ainsi que prendre en compte le système de phonologie de la langue cible. La problématique pour les paires de langues peu dotées lie à la pénurie des ressources linguistiques. Dans ce travail de recherche, nous présentons une démonstration de conversion de graphème en phonème pour pallier au problème de translittération pour une paire de langues peu dotée, avec une application sur français-vietnamien. Notre système nécessite un petit corpus d'apprentissage phonétique bilingue. Nous avons obtenu des résultats prometteurs, avec un gain de +4,40% de score BLEU, par rapport au système de base utilisant l'approche de traduction automatique statistique.

Mots clés : Translittération, graphème, phonème, traduction automatique, langue peu dotée, français-vietnamien.