talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

anymalign : un outil d’alignement sous-phrastique libre pour les êtres humains

Adrien Lardilleux, Yves Lepage

Résumé : Nous présentons anymalign, un aligneur sous-phrastique grand public. Ses résultats ont une qualité qui rivalise avec le meilleur outil du domaine, GIZA++. Il est rapide et simple d’utilisation, et permet de produire dictionnaires et autres tables de traduction en une seule commande. À notre connaissance, c’est le seul outil au monde permettant d’aligner un nombre quelconque de langues simultanément. Il s’agit donc du premier aligneur sousphrastique réellement multilingue.

Abstract : We present anymalign, a sub-sentential aligner oriented towards end users. It produces results that are competitive with the best known tool in the domain, GIZA++. It is fast and easy to use, and allows dictionaries or translation tables to be produced in a single command. To our knowledge, it is the only tool in the world capable of aligning any number of languages simultaneously. It is therefore the first truly multilingual sub-sentential aligner.

Mots clés : alignement sous-phrastique, multilinguisme, table de traduction

Keywords : sub-sentential alignment, multilinguism, translation table