SEBRAG : Vers l'Utilisation des LLM pour une Tâche de Questions-Réponses Extractive
Quentin Signé, Thiziri Belkacem, Mohand Boughanem, Jose G Moreno
Résumé : L'émergence des grands modèles de langage (LLM) a révolutionné le domaine des questions-réponses (QR). Cependant, leur tendance à halluciner représente un défi majeur en recherche d'information (RI), notamment en domaines critiques comme la maintenance aéronautique. Pour répondre à cette problématique, cet article explore la capacité des LLM pour des tâches de QR extractives, à l'instar des modèles encodeurs. Ainsi, nous proposons une approche de génération augmentée par recherche d'information (RAG) utilisant un outil d'extraction de chaînes de caractères, permettant au LLM d'extraire une réponse plutôt que de la générer. Les expériences réalisées sur un jeu de données de maintenance aéronautique révèlent que cette approche permet de mieux contrôler l'hallucination par rapport aux méthodes RAG traditionnelles, tout en gardant une précision comparable aux modèles encodeurs extractifs. Cette approche montre son potentiel pour des applications hautement techniques où la précision et la fiabilité sont primordiales.
Mots clés : Génération Augmentée par Recherche d'Information ; Questions-Réponses ; Maintenance Technique.