Approches de recherche d'information pour l'amélioration des amorces appliquées à la compréhension de la parole avec apprentissage en quelques exemples
Pierre Lepagnol, Sahar Ghannay, Thomas Gerald, Christophe Servan, Sophie Rosset
Résumé : Comprendre les requêtes des utilisateurs est fondamental dans de nombreuses applications, telles que les assistants personnels, la réservation d’hôtels ou la recommandation de produits. De fait, il est crucial de développer une approche efficace de compréhension de la parole afin d'assurer la fiabilité des systèmes. L'état de l'art actuel repose sur des approches supervisées utilisant une grande quantité de données annotées. Cependant, il existe des tâches spécifiques pour lesquelles les données annotées sont très limitées. En parallèle, les grands modèles de langue (LLM) instruits ont montré des performances notables sur des tâches non vues par les modèles dans une configuration d’apprentissage en quelques exemples (few-shot learning), lorsqu'on fournit à ces mêmes modèles des amorces adéquates. Dans ces travaux, nous proposons l'exploration de méthodes de sélection d'exemples fondées sur la recherche d'information pour construire les amorces dans le cadre de tâches de compréhension de la parole. L'évaluation de l'approche sur différents corpus montre que les approches de RI lexicales améliorent significativement les performances, sans allonger les amorces.
Mots clés : Compréhension de la parole, RI, amorces, apprentissage en quelques exemples