RAC : Clarification Augmentée par la Recherche pour une Recherche Conversationnelle Fidèle
Ahmed Rayane Kebir, Vincent Guigue, Lynda Said Lhadj, Laure Soulier
Résumé : Les questions de clarification permettent aux systèmes de recherche conversationnelle de lever les ambiguïtés des requêtes utilisateurs. Les travaux existants se concentrent principalement sur la fluidité et l’alignement avec l’intention, tandis que l’ancrage des clarifications dans le corpus reste peu étudié. Sans cet ancrage, les systèmes risquent de poser des questions auxquelles les documents disponibles ne permettent pas de répondre. Nous proposons RAC (Retrieval-Augmented Clarification), un cadre visant à générer des clarifications fidèles au corpus. Après avoir comparé plusieurs stratégies d’indexation, nous ajustons finement un modèle de langue afin d’exploiter le contexte de recherche et de favoriser des questions fondées sur des preuves. Une optimisation contrastive par préférences privilégie les questions appuyées par des passages récupérés. Les évaluations sur quatre jeux de données de référence montrent des améliorations significatives. Nous introduisons de nouvelles métriques basées sur la NLI et le data-to-text pour mesurer l’ancrage contextuel et la fidélité.
Mots clés : Conversational Search, Clarifying Questions, RAG