Cadre d'évaluation pour les systèmes de génération augmentée (RAG) : combinaison des performances de recherche d'informations et de LLM
Mohamed-Amine El-Yagoub, Philippe Mulhem, Jean-Pierre Chevallet, Eric Gaussier
Résumé : Cet article introduit un nouveau cadre d'évaluation pour les systèmes RAG, en comblant les lacunes des approches précédentes. La première phase consiste à concevoir un ensemble de données avec des parties pertinentes extraites pour chaque exemple, représentant les informations nécessaires pour répondre à une question donnée, et à proposer une métrique d'évaluation pour les systèmes IR basée sur la présence de ces parties dans le contenu récupéré. La deuxième phase explore la relation entre le système de RI et les évaluations RAG globales et utilise cette relation pour prédire les performances globales du RAG à partir des performances du SRI. Cette approche élimine le besoin de réponses coûteuses générées par LLM et d'évaluations ultérieures, réduisant ainsi les coûts et fournissant un cadre d'évaluation plus complet et plus robuste pour les systèmes RAG.
Mots clés : RAG, cadre, évaluation