ERAG : le RAG fonctionne-t-il pour la recherche d’experts sur le TREC Enterprise Track ?
Sarah Nouali, Ismail Badache, Patrice Bellot
Résumé : La recherche d'experts est depuis longtemps une application courante de la recherche d'information (RI). Les premiers travaux se concentraient principalement sur des modèles probabilistes basés principalement sur l'analyse de documents. Cependant, l'émergence des grands modèles de langage (LLM) a ouvert de nouvelles possibilités. Dans cet article, nous revisitons la piste TREC Enterprise en appliquant des méthodes récentes basées sur les LLM. Nous visons à évaluer leur efficacité dans la recherche d'experts, en examinant dans quelle mesure les techniques de génération à enrichissement contextuel (RAG) aident à identifier correctement des experts, système que nous nommons dans cet article : ERAG (Expert Retrieval with Augmented Generation). Nos expériences ont été menées sur la collection de tests CERC (CSIRO), l'un des premiers benchmarks dans ce domaine. Il nous a permis d'évaluer les deux phases d'un RAG: la recherche documentaire et le classement des experts. Nos résultats montrent que le RAG égale et surpasse les performances les plus élevées rapportées dans la présentation originale de TREC 2007 Enterprise Track, soulignant le potentiel de ces méthodes pour la recherche d'experts.
Mots clés : Recherche d'information, Grands modèles de langage, Recherche d'experts, Génération à enrichissement contextuel, TREC Enterprise, RAG