talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Compositionnalité et contextes issus de corpus comparables pour la traduction terminologique

Emmanuel Morin, Béatrice Daille

Résumé : Dans cet article, nous cherchons à mettre en correspondance de traduction des termes extraits de chaque partie monolingue d’un corpus comparable. Notre objectif concerne l’identification et la traduction de termes spécialisés. Pour ce faire, nous mettons en oeuvre une approche compositionnelle dopée avec des informations contextuelles issues du corpus comparable. Notre évaluation montre que cette approche améliore significativement l’approche compositionnelle de base pour la traduction de termes complexes extraits de corpus comparables.

Abstract : In this article, we study the possibilities of improving the alignment of equivalent terms monolingually acquired from bilingual comparable corpora. Our overall objective is to identify and to translate highly specialised terminology. We applied a compositional approach enhanced with pre-processed context information. Our evaluation demonstrates that our alignment method outperforms the compositional approach for translationally equivalent term discovery from comparable corpora.

Mots clés : Corpus comparable, compositionnalité, information contextuelle, lexique bilingue

Keywords : Comparable Corpora, compositionality, context information, bilingual lexicon