talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Traitements linguistiques pour la synthèse de la parole à partir du texte

Philippe Boula de Mareüil

Résumé : Cet article est consacré aux traitements linguistiques qui ont été implémentés dans le système de synthèse de la parole à partir du texte du LIMSI-CNRS. Ils se divisent en deux volets : conversion graphème-phonème et analyse syntaxique, essentiellement pour la génération automatique de la prosodie. Nous nous sommes efforcé de procéder par intension : conversion graphème-phonème par règles plutôt qu'à base de lexique d'exceptions (un critère de règle plus générale a été mis en évidence), et étiquetage en parties du discours non lexicaliste. L'approche structurelle a également été préférée aux modèles probabilistes. Une grammaire en tronçons a été développée, qui segmente la phrase en séquences non récursives. Celles-ci, définies comme des ensembles de catégories possibles, permettent de définir des frontières prosodiques potentielles (mineures, majeures ou majeures intermédiaires). Ces traitements linguistiques, en cours de commercialisation, ont fait l'objet de nombreux tests. Le module de transcription graphème-phonème, notamment, a obtenu le score le plus élevé des 8 convertisseurs ayant participé à une campagne d'évaluation de l'AUPELF-UREF.