talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Une étude pilote sur l'affinage des modèles TTS créoles : le vocabulaire lexificateur ou la phonologie du substrat, lequel est le plus déterminant ?

Emmett Strickland, Valentina Fedchenko, Marc Evrard

Résumé : Nous examinons si l’apprentissage par transfert à partir des langues lexificatrices ou substrats peut améliorer la performance des modèles de TTS pour les créoles. Nous avons mené une expérience contrôlée utilisant deux créoles d'origines lexicales distinctes : le pidgin nigérian et le créole guadeloupéen. Pour les deux langues, des jeux de données ont été enregistrés afin d'affiner des modèles anglais, français et yoruba. Des métriques objectives et des évaluations subjectives informelles ont été employées pour évaluer la qualité. Bien que partiellement non concluants, nos résultats suggèrent que les modèles fondés sur le français surpassent les autres pour les deux créoles, tandis que les modèles fondés sur le yoruba présentent des performances plus faibles. Ces résultats suggèrent que les influences historiques seules ne suffisent pas à prédire l’efficacité de l’apprentissage par transfert, et que la compatibilité phonotactique ainsi que la profondeur orthographique pourraient également être des facteurs pertinents.

Mots clés : créoles, TTS, apprentissage par transfert