talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Traitement automatique des langues des signes : le projet Dicta-Sign, des corpus aux applications

Annelies Braffort, Michael Filhol, Jérémie Segouat

Résumé : Cet article présente Dicta-Sign, un projet de recherche sur le traitement automatique des langues des signes (LS), qui aborde un grand nombre de questions de recherche : linguistique de corpus, modélisation linguistique, reconnaissance et génération automatique. L’objectif de ce projet est de réaliser trois applications prototypes destinées aux usagers sourds : un traducteur de termes de LS à LS, un outil de recherche par l’exemple et un Wiki en LS. Pour cela, quatre corpus comparables de cinq heures de dialogue seront produits et analysés. De plus, des avancées significatives sont attendues dans le domaine des outils d’annotation. Dans ce projet, le LIMSI est en charge de l’élaboration des modèles linguistiques et participe aux aspects corpus et génération automatique. Nous nous proposons d’illustrer l’état d’avancement de Dicta-Sign au travers de vidéos extraites du corpus et de démonstrations des outils de traitement et de génération d’animations de signeur virtuel.

Abstract : This paper presents Dicta-Sign, a research project related to sign language (SL) processing. It covers numerous research topics: corpus linguistics, linguistic modelling, automatic recognition and generation. The aim of this project is to design three proof-of-concept end user applications: an SL-to-SL term translator, a search-by-example tool, and a SL wiki. For that, four comparable corpora of five hours will be produced and analysed. Aside from these applications, we also expect major improvements to be integrated to annotation tools. In this project, LIMSI is in charge of the linguistic modelling, and participates in building the corpus and in the generation efforts. We propose to illustrate the current work with excerpts from the corpus and demonstrations of the processing and generation tools.

Mots clés : Langue des signes, corpus vidéo comparables, reconnaissance automatique, génération automatique

Keywords : Sign languages, comparable video corpora, automatic recognition, automatic generation