talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

ATALAT : Un corpus parallèle latin–français pour la traduction automatique

Eunice Akani, Tristan Vigliano, Helena Unzue Gros, Youssef Trardi

Résumé : La traduction automatique du latin vers le français représente un défi majeur en raison du manque de corpus alignés et des particularités syntaxiques du latin. Ces difficultés rendent la traduction automatique du latin complexe. Cet article présente la création d'un corpus aligné du latin vers le français, conçu pour entraîner des systèmes de traduction automatique. Nous présentons les étapes de collecte des textes latins et français ainsi que l'alignement de ceux-ci. Puis nous évaluons les performances de modèles de traduction automatique entraînés sur ce corpus, en soulignant les premiers résultats et les pistes d'amélioration. Cette recherche constitue une étape importante pour faciliter la traduction automatique du latin et soutenir les travaux des chercheurs en sciences humaines.

Mots clés : Traduction automatique, Latin-Français, Corpus