talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Méthodes statistiques et apprentissage automatique pour l’évaluation de requêtes en recherche documentaire

Jens Grivolla

Résumé : Pour la recherche documentaire il est souvent intéressant d’avoir une bonne mesure de confiance dans les réponses trouvées par le moteur de recherche. Une bonne estimation de pertinence peut permettre de faire un choix entre plusieurs réponses (venant éventuellement de différents systèmes), d’appliquer des méthodes d’enrichissement additionnelles selon les besoins, ou encore de permettre à l’utilisateur de prendre des décisions (comme d’approfondir la recherche à travers un dialogue). Nous proposons une méthode permettant de faire une telle estimation, utilisant des connaissances extraites d’un ensemble de requˆetes connues pour en déduire des prédictions sur d’autres requˆetes posées au système de recherche documentaire.

Abstract : In document retrieval applications it is often interesting to have a measure of confidence in the answers found by the retrieval system. A good relevance estimation can allow us to make a choice between different answers (possibly provided by different sources), apply additional expansion techniques according to the specific needs, or enable the user to make decisions (such as to refine the search interactively). We propose a method that allows us to make such estimations, using knowledge extracted from a known query corpus to deduce predictions on new queries presented to the document retrieval system.

Mots clés : apprentissage/décision automatique, recherche documentaire, expansion de requêtes, évaluation de difficulté

Keywords : automatic learning/decision, document retrieval, query expansion, difficulty evaluation