talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Système de traduction automatique neuronale français-mongol (Historique, mise en place et évaluations)

Shuai Gao

Résumé : La traduction automatique (abrégé ci-après TA) connaît actuellement un développement rapide, pendant lequel les langues peu dotées semblent pourtant moins développées. En effet, il existe moins de recherches sur ces dernières. Notamment, aucune recherche publiée n’a été trouvée sur la paire de langues français-mongol. Cet article entame une nouvelle étape dans les recherches en TA pour cette paire de langues peu dotée. Nous décrivons l’historique de la TA et en établissons un état de l’art pour le mongol. Ensuite, nous nous employons à mettre en place notre propre système de TA à partir des outils et ressources open source. Outre l’évaluation automatique comme méthode pour apprécier sa performance, nous concevons une méthode d’évaluation humaine originale nommée « IFF » permettant de mieux connaître les forces et les faiblesses de notre système par rapport à des moteurs de traduction commerciaux.

Mots clés : traduction automatique neuronale, langues peu dotées, langue mongole, évaluation automatique, évaluation humaine, score BLEU