talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Corpus OTG et ECOLE_MASSY : vers la constitution d’une collection de corpus francophones de dialogue oral diffusés librement

Jean-Yves Antoine, Sabine Letellier-Zarshenas, Pascale Nicolas, Igor Schadle, Jean Caelen

Résumé : Cet article présente deux corpus francophones de dialogue oral (OTG et ECOLE_MASSY) mis librement à la disposition de la communauté scientifique. Ces deux corpus constituent la première livraison du projet Parole Publique initié par le laboratoire VALORIA. Ce projet vise la constitution d’une collection de corpus de dialogue oral enrichis par annotation morpho-syntaxique. Ces corpus de dialogue finalisé sont essentiellement destinés à une utilisation en communication homme-machine.

Abstract : This paper presents two corpora (OTG et ECOLE_MASSY) of French spoken dialogue which are the first delivery of the Parole_Publique (in English : Public Speech) project held by the VALORIA laboratory. This project aims at the achievement of a collection of spoken dialogue corpora that is freely distributed on the WWW. It is primarily intended for researches on man-machine communication.

Mots clés : ressources linguistiques francophones, dialogue oral, communication homme-machine

Keywords : French speaking linguistic ressources, spoken dialogue, man-machine communication