talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

PTSVOX : une base de données pour la comparaison de voix dans le cadre judiciaire

Anaïs Chanclu, Laurianne Georgeton, Corinne Fredouille, Jean-Francois Bonastre

Résumé : Une base de donnée de parole a été créée par le \acrfull{scpts} en vue d'obtenir un maximum de données pertinentes pour couvrir différents cas rencontrés en comparaison de voix dans le cadre judiciaire, en mettant l'accent sur la variabilité intra-locuteur. La base de données contient 369 locuteur·rices qui ont été enregistré·es au microphone et au téléphone dans deux écoles de police. 24 locuteur·rices ont été enregistré·es une fois par mois pour couvrir la variabilité intra-locuteur. Ces locuteur·rices ont été enregistré·es en parole spontanée et lecture. La base peut être utilisée pour mesurer l'influence de la variabilité intra-locuteur, et plus spécialement le style de parole et le matériel d'enregistrement. Dans cet article, nous présentons dans un premier temps la base PTSVOX, puis l'interface que nous avons développée pour parcourir la base. Enfin, nous décrivons des protocoles standards pour étudier la performance des systèmes de comparaison de voix.

Mots clés : comparaison de voix dans le cadre judiciaire, variabilité intra-locuteur, reconnaissance du locuteur, base de données PTSVOX