Utilisation des modèles de parole pour la recherche lexicale par audio dans les dictionnaires : application au Teochew
Siman Chen, Ilaine Wang, Maxime Fily, Pierre Magistry
Résumé : Cet article porte sur l'utilisation des méthodes la détection de termes parlés par l'exemple (Query by Example - Spoken Term Detection) à une application réelle et dans un contexte de langue peu dotée : l'implémentation d'une fonctionnalité de requête orale pour un dictionnaire de teochew créé par sa diaspora. Cette fonctionnalité permet de faire des recherches dans un dictionnaire sans connaissance préalable des systèmes d'écriture utilisés, rendant ainsi le dictionnaire accessible aux locuteurs non-lettrés d'une langue. Nous comparons deux approches~: la première repose sur la reconnaissance de la parole (ASR) avec un appariement text-to-text, la seconde sur la déformation temporelle dynamique (DTW) avec un appariement audio-to-audio. Nos résultats montrent que l'approche ASR fonctionne mieux. Par ailleurs, celle-ci a pu bénéficier d'optimisations supplémentaires, qui ne sont pas aussi directement applicables à l'approche DTW.
Mots clés : Modèles de parole, langues peu dotées, reconnaissance automatique de la parole, Dynamic Time Warping, teochew, requête par l'exemple, détection de termes parlés