talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Traduction automatique ancrée dans l’analyse linguistique

Jessie Pinkham, Martine Smets

Résumé : Nous présentons dans cet article le système de traduction français-anglais MSR-MT développé à Microsoft dans le groupe de recherche sur le traitement du language (NLP). Ce système est basé sur des analyseurs sophistiqués qui produisent des formes logiques, dans la langue source et la langue cible. Ces formes logiques sont alignées pour produire la base de données du transfert, qui contient les correspondances entre langue source et langue cible, utilisées lors de la traduction. Nous présentons différents stages du développement de notre système, commencé en novembre 2000. Nous montrons que les performances d’octobre 2001 de notre système sont meilleures que celles du système commercial Systran, pour le domaine technique, et décrivons le travail linguistique qui nous a permis d’arriver à cette performance. Nous présentons enfin les résultats préliminaires sur un corpus plus général, les débats parlementaires du corpus du Hansard. Quoique nos résultats ne soient pas aussi concluants que pour le domaine technique, nous sommes convaincues que la résolution des problèmes d’analyse que nous avons identifiés nous permettra d’améliorer notre performance.

Abstract : In this paper, we present an overview of the MSR-MT translation system for French-English, developed at Microsoft Research in the NLP group. Our system is based on rule-based analysis which produces logical form representations of the source language and the target language. These are aligned to produce mappings then stored in an example-base. We examine the development of the system since November 2000, and show that by October 2001, we had exceeded the quality of the commercial system Systran in the technical domain. We describe the linguistic work that allowed our system to improve. We present preliminary results on the Hansard parliamentary corpus. While these results are less impressive currently, we are convinced that changes to linguistic analysis will allow the system performance to improve.

Mots clés : Traduction automatique, français-anglais, base d’exemples

Keywords : Automatic translation, French-English, example-base