talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

De la Chambre des communes à la chambre d’isolement : adaptabilité d’un système de traduction basé sur les segments de phrases

Philippe Langlais, Fabrizio Gotti, Alexandre Patry

Résumé : Nous présentons notre participation à la deuxième campagne d’évaluation de CESTA, un projet EVALDA de l’action Technolangue. Le but de cette campagne consistait à tester l’aptitude des systèmes de traduction à s’adapter rapidement à une tâche spécifique. Nous analysons la fragilité d’un système de traduction probabiliste entraîné sur un corpus hors-domaine et dressons la liste des expériences que nous avons réalisées pour adapter notre système au domaine médical.

Abstract : We present our participation in the second evaluation campaign of CESTA, an EVALDA project within the framework of Technolangue. The goal of this task consisted in testing the adaptability of translation systems.We analyze the inadequacy of a statistical phrase-based system trained on legislative texts to translate medical corpora. We describe the experiments we conducted in order to adapt our engine to the new task.

Mots clés : traduction probabiliste, adaptabilité, aspiration de bitextes, mémoire de traduction

Keywords : statistical translation, adaptation, Web crawling, memory-based translation