talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Annotations de particules de discours en français sur une large variété de corpus de parole

Katarina Bartkova, Mathilde Dargnat, Denis Jouvet, Lou Lee

Résumé : En français, certains mots et expressions sont fréquemment utilisés en tant que particules de discours dans le langage parlé, en particulier en parole spontanée. Comme la signification sémantique de tels mots varie selon qu’ils sont utilisés en tant que particule de discours ou non, l’identification correcte de leur fonction discursive est importante. Pour étudier les particules de discours, ainsi que leurs corrélats prosodiques, une large variété de corpus de parole correspondant à différents degrés de spontanéité sont considérés. Cela va de la parole préparée (e.g., contes et journaux d’information radiodiffusés) à la parole spontanée (e.g., interviews et interactions entre personnes). Ce papier présente les corpus considérés, la sélection d’occurrences des mots, l’annotation de leur fonction discursive, les paramètres prosodiques calculés, ainsi que la fréquence d’utilisation de quelques mots en tant que particule de discours sur les divers corpus.

Mots clés : Particules de discours, français, paramètres prosodiques, annotation