Analyse de l'effet de la réverbération sur la reconnaissance automatique de la parole
Sébastien Ferreira, Jérôme Farinas, Julien Pinquier, Julie Mauclair, Stéphane Rabant
Résumé : La Reconnaissance Automatique de la Parole (RAP) est moins performante lorsque le signal de parole est de mauvaise qualité. Dans cette étude nous analysons les erreurs commises par les systèmes de RAP lorsque la parole transcrite est réverbérée afin de mieux comprendre les raisons de ces erreurs. Notre analyse permet de mettre en valeur les erreurs dues notamment à un mauvais alignement phonétique. Nous avons pu constater que les phonèmes de courte durée sont majoritairement supprimés lors du décodage phonétique. De plus, les phonèmes détectés, qu'ils soient corrects ou pas, ont tendance à avoir la même durée. Ce qui est anormal pour certaines classes phonétiques comme les voyelles courtes ou les plosives. Nous avons aussi analysé les principales confusions entre les différentes classes phonétiques. Finalement nous avons pu montrer que les erreurs lors de l'alignement phonétique des systèmes de transcription automatique entraîne beaucoup d'erreurs de détection.
Mots clés : reconnaissance automatique de la parole, réverbération, analyse d'erreur