talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Representational and architectural issues in a limited-domain medical speech translator

Manny Rayner, Pierrette Bouillon, Marianne Santaholma, Yukie Nakao

Résumé : Cet article dresse un aperçu du système MedSLT, un système de traduction de la parole dans le domaine médical pour un vocabulaire limité. Il met l’accent sur le problème du choix du type de représentation pour les constructions temporelles et causales. Nous montrons que celles-ci ne peuvent pas être représentées par des structures plates, généralement utilisées pour ce type d’application, mais qu’elles nécessitent des stuctures plus riches, enchâssées, qui permettent d’obtenir une traduction plus adéquate. Nous expliquons comment produire ces représentations et écrire des règles de traduction économiques qui mettent en correspondance les représentations sources dans la représentation interlingue correspondante.

Abstract : We present an overview of MedSLT, a medium-vocabulary medical speech translation system, focussing on the representational issues that arise when translating temporal and causal concepts. Although flat key/value structures are strongly preferred as semantic representations in speech understanding systems, we argue that it is infeasible to handle the necessary range of concepts using only flat structures. By exploiting the specific nature of the task, we show that it is possible to implement a solution which only slightly extends the representational complexity of the semantic representation language, by permitting an optional single nested level representing a subordinate clause construct. We sketch our solutions to the key problems of producing minimally nested representations using phrase-spotting methods, and writing cleanly structured rule-sets that map temporal and phrasal representations into a canonical interlingual form.

Mots clés : reconnaissance de la parole, traduction de la parole, aide au diagnostic médical

Keywords : speech understanding, speech translation, computer-aided diagnosis