talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Une grammaire multilingue partagée pour la traduction automatique de la parole

Pierrette Bouillon, Manny Rayner, Bruna Novellas, Yukie Nakao, Marianne Santaholma, Marianne Starlander, Nikos Chatzichrisafis

Résumé : Aujourd’hui, l’approche la plus courante en traitement de la parole consiste à combiner un reconnaisseur statistique avec un analyseur robuste. Pour beaucoup d’applications cependant, les reconnaisseurs linguistiques basés sur les grammaires offrent de nombreux avantages. Dans cet article, nous présentons une méthodologie et un ensemble de logiciels libres (appelé Regulus) pour dériver rapidement des reconnaisseurs linguistiquement motivés à partir d’une grammaire générale partagée pour le catalan et le français.

Abstract : Today, the most common architecture for speech understanding consists of a combination of statistical recognition and robust semantic analysis. For many applications, however, grammar-based recognisers can offer significant advantages. In this paper, we present a methodology and an Open Source platform (Regulus), which together permit rapid derivation of linguistically motivated recognisers, in either language, from a bilingual grammar of Catalan and French.

Mots clés : traduction automatique de la parole, modélisation du langage, grammaire d’unification, reconnaissance linguistique, grammaires multilingues

Keywords : speech to speech translation, language modelling, unification grammar, grammar-based recognition, multilingual grammars