Sélection Dynamique du Contexte pour la Génération Augmentée de Recherche D’Information
Maya Iratni, Mohand Boughanem, Taoufiq Dkaki
Résumé : La génération augmentée par la recherche d’information (RAG) combine des modèles de langue avec des corpus externes afin de soutenir des tâches nécessitant des connaissances externes, telles que la question-réponse en domaine ouvert. Les systèmes RAG standard utilisent généralement une stratégie de recherche d’information fixe top-k, qui récupère le même nombre de passages indépendamment des besoins de la requête. Cela peut conduire soit à des preuves insuffisantes, soit à l’inclusion de contextes non pertinents, qui entraînent une dégradation des performances de génération. Dans le cadre de ce travail, nous menons une étude empirique sur la manière dont les passages non pertinents récupérés affectent la génération. Sur la base de ces observations, nous proposons un module de classification basé sur la taille du contexte, qui prédit de manière dynamique la quantité de contexte nécessaire en fonction des besoins spécifiques de la requête. Nous intégrons cette approche dans un pipeline RAG complet et démontrons une amélioration des performances par rapport à plusieurs références.
Mots clés : Génération augmentée par la recherche d’information (RAG), recherche d’information, reranking, question-réponse multi-hop, grands modèles de langage (LLM).