talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Reconnaissance automatique de la parole : génération des prononciations non natives pour l'enrichissement du lexique

Ismael Bada, Dominique Fohr, Irina Illina

Résumé : Dans cet article nous proposons une méthode d’adaptation du lexique, destinée à améliorer les systèmes de la reconnaissance automatique de la parole (SRAP) des locuteurs non natifs. En effet, la reconnaissance automatique souffre d’une chute significative de ses performances quand elle est utilisée pour reconnaître la parole des locuteurs non natifs, car les phonèmes de la langue étrangère sont fréquemment mal prononcés par ces locuteurs. Pour prendre en compte ce problème de prononciations erronées, notre approche propose d’intégrer les prononciations non natives dans le lexique et par la suite d’utiliser ce lexique enrichi pour la reconnaissance. Pour réaliser notre approche nous avons besoin d’un petit corpus de la parole non native et de sa transcription. Pour générer les prononciations non natives, nous proposons de tenir compte des graphèmes dans les prononciations analysées, en vue de générer de manière automatique des règles de création de nouvelles prononciations. Ces nouvelles prononciations seront ajoutées au lexique. Nous présentons une évaluation de notre méthode sur un corpus de locuteurs non natifs français s’exprimant en anglais.

Mots clés : reconnaissance automatique de la parole, locuteurs non natifs, lexique