talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Alignement automatique pour la compréhension littérale de l'oral par approche segmentale

Stéphane Huet, Fabrice Lefèvre

Résumé : Les approches statistiques les plus performantes actuellement pour la compréhension automatique du langage naturel nécessitent une annotation segmentale des données d'entraînement. Nous étudions dans cet article une alternative permettant d'obtenir de façon non-supervisée un alignement segmental d'unités conceptuelles sur les mots. L'impact de l'alignement automatique sur les performances du système de compréhension est évalué sur une tâche de dialogue oral.

Abstract : Most recent efficient statistical approaches for language understanding require a segmental annotation of the training data. In this paper we study an alternative that obtains a segmental alignment of conceptual units with words in an unsupervised way. The impact of the automatic alignment on the understanding system performance is evaluated on a spoken dialogue task.

Mots clés : Alignement non-supervisé, compréhension de la parole

Keywords : Unsupervised alignment, spoken language understanding