talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Construction (très) rapide de tables de traduction à partir de grands bi-textes

Li Gong, Aurélien Max, François Yvon

Résumé : Dans cet article de démonstration, nous introduisons un logiciel permettant de construire des tables de traduction de manière beaucoup plus rapide que ne le font les techniques à l’état de l’art. Cette accélération notable est obtenue par le biais d’un double échantillonnage : l’un permet la sélection d’un nombre limité de bi-phrases contenant les segments à traduire, l’autre réalise un alignement à la volée de ces bi-phrases pour extraire des exemples de traduction.

Mots clés : traduction automatique statistique, développement efficace, temps de calcul

Keywords : statistical machine translation, efficient development, computation time