talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Prévention des risques liés à l’environnement de travail : constitution d’un corpus oral en vue de son traitement automatique

Sandra Cestic, Iris Eshkol-Taravella

Résumé : Cette communication présente la constitution d’un corpus oral destiné à l’étude de l’expression verbale de la perception de facteurs physiques dans les environnements de travail. Cette étude a pour objectif d’apporter les connaissances nécessaires à la finalisation du développement d’une application informatique dédiée à la prévention des nuisances physiques au travail générées par le bruit et les ambiances thermiques. Nous abordons la méthodologie mise en œuvre pour collecter des données orales authentiques et constituer un corpus susceptible d’anticiper au mieux les procédures de traitement automatique pour l’extraction d’informations relatives aux risques. Le retour sur notre pratique embrasse toutes les étapes de la constitution de corpus pour répondre à l'objectif d'étude.

Mots clés : corpus oral, prévention des risques, environnement de travail, annotation de la perception, traitement automatique du langage naturel.