talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

L’apport de connaissances linguistiques en recherche documentaire

Claude De Loupy

Résumé : L’utilisation de connaissances et de traitements linguistiques évolués en recherche documentaire ne fait pas l’unanimité dans le milieu scientifique. En effet, de nombreuses expériences semblent montrer que les résultats obtenus ne sont pas améliorés, voire sont parfois dégradés, lorsque de telles connaissances sont utilisées dans un système de RD. Dans ce tutoriel, nous montrons que les environnements d’évaluation ne sont pas adaptés aux besoins réels d’un utilisateur car celui-ci recherche presque toujours une information. Il veut donc retrouver des documents pertinents le plus rapidement possible car ce n’est pas là le but de sa recherche. Le temps global de la recherche est donc fondamentalement important. Néanmoins, le cadre d’évaluation TREC nous permet de montrer que l’utilisation de connaissances linguistiques permet d’augmenter la précision des premiers documents renvoyés, ce qui est très important pour diminuer le temps de recherche.

Abstract : The use of linguistic knowledge and natural language processing (NLP) systems is generally not considered to be the best way to perform document retrieval. Indeed numerous experiments seem to show that NLP does not improve the performances and, even can decrease them. In this tutorial we show the environments used for evaluation do not fit the real world needs. Almost every time, the user search for an information. He wants relevant documents as soon as possible because they are not his goal. So, time is really important in evaluation of document retrieval systems. Nevertheless, using TREC, we show NLP can lead to a better precision for the first documents retrieved and this is really important in order to improve the speed of search process.