talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

De nouvelles méthodes pour l'exploration de l'interface syntaxe-prosodie : un treebank intonosyntaxique et un système de synthèse pour le pidgin nigérian

Emmett Strickland, Anne Lacheret-Dujour, Marc Evrard, Sylvain Kahane, Dana Aubakirova, Dorin Doncenco, Diego Torres, Perrine Quennehen, Bruno Guillaume

Résumé : Cet article présente deux ressources récemment développées pour explorer l'interface prosodie-syntaxe en pidgin nigérian, une langue à faibles ressources d'Afrique de l'Ouest. La première est un treebank intonosyntaxique dans laquelle chaque token est associé à une série de caractéristiques prosodiques au niveau de la syllabe, ce qui permet d'analyser diverses structures syntaxiques et prosodiques en utilisant une même interface. La seconde est un système de synthèse de la parole entraîné sur le même ensemble de données, conçu pour permettre un contrôle direct sur les contours intonatifs de la parole générée. Cet outil a été développé pour nous permettre de tester les hypothèses formulées à partir de l'exploration du treebank. Cet article est largement une adaptation de deux publications récentes présentant chaque outil, avec un accent sur leur interconnexion dans notre recherche en cours.

Mots clés : pidgin nigérian,linguistique de corpus,prosodie,treebank,synthèse de la parole