talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Indexation Sémantique par Coupes de Redondance Minimale dans une Ontologie

Florian Seydoux, Jean-Cédric Chappelier

Résumé : Plusieurs travaux antérieurs ont fait état de l’amélioration possible des performances des systèmes de recherche documentaire grace à l’utilisation d’indexation sémantique utilisant une ontologie (p.ex. WordNet). La présente contribution décrit une nouvelle méthode visant à réduire le nombre de termes d’indexation utilisés dans une indexation sémantique, en cherchant la coupe de redondance minimale dans la hiérarchie fournie par l’ontologie. Les résultats, obtenus sur diverses collections de documents en utilisant le dictionnaire EDR, sont présentés.

Abstract : Several former works have shown that it is possible to improve information retrieval performances using semantic indexing, adding additional information coming from a thesaurus (e.g.WordNet). This paper presents a new method to reduce the number of "concepts"used to index the documents, by determining a minimum redundancy cut in the hierarchy provided by the thesaurus. The results of experiments carried out on several standard document collections using the EDR thesaurus are presented.

Mots clés : Indexation sémantique, Recherche documentaire, Redondance minimale, Ontologie

Keywords : Semantic Indexing, Information Retrieval, Minimal Redundancy, Ontology