talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Adaptation de modèles de reconnaissance automatique de la parole pour le yiddish, langue sans standard oral

Keming Yi, Valentina Fedchenko

Résumé : Ce travail explore l’adaptation de la reconnaissance automatique de la parole au yiddish dans un contexte marqué par une forte variabilité dialectale et l’absence de variété orale standardisée. Nous évaluons l’efficacité de modèles multilingues récents ainsi que différentes stratégies d’adaptation, en particulier celles liées à la sélection et à la présentation des données d’entraînement, afin de transcrire cette diversité linguistique. Les résultats mettent en évidence l’impact des stratégies de présentation des données dialectales lors de l’affinage de modèles préentraînés, ainsi que des ressources limitées disponibles, sur les performances globales du système. Cette recherche contribue ainsi au développement de modèles de reconnaissance de la parole plus robustes et inclusifs, capables de résister aux contextes multidialectaux.

Mots clés : yiddish, reconnaissance automatique de la parole, langue peu dotée, variabilité dialectale, adaptation de modèles acoustiques