talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

La reconnaissance automatique de phonèmes est-elle réellement adaptée pour l’analyse de la parole spontanée ?

Vincent P. Martin, Colleen Beaumard, Charles Brazier, Jean-Luc Rouas, Yaru Wu

Résumé : La transcription phonémique automatique de la parole spontanée trouve des applications variées, notamment dans l'éducation et la surveillance de la santé. Ces transcriptions sont habituellement évaluées soit par la précision de l'identification des phonèmes, soit par leur segmentation temporelle. Jusqu'à présent, aucun système n'a été évalué simultanément sur ces deux tâches. Cet article présente l'évaluation d'un système de transcription phonétique du français spontané (corpus Rhapsodie) basé sur Kaldi. Ce système montre de bons résultats en identification des phonèmes et de leurs catégories, avec des taux d'erreur de 19,2% et 13,4% respectivement. Il est cependant moins performant en segmentation, manquant en moyenne 40% de la durée des phonèmes et 34% des catégories. Les performances s'améliorent avec le niveau de planification de la parole. Ces résultats soulignent le besoin de systèmes de transcription phonétique automatique fiables, nécessaires à des analyses plus approfondies de la parole spontanée.

Mots clés : Reconnaissance Automatique de la Parole,Reconnaissance de phonèmes,Segmentation de phonèmes