talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Increased Retrieval Performance using Word Sense Discrimination

Atelach Alemu Argaw, Lars Asker

Résumé : Nous prouvons que l’information mutuelle entre des paires de mots peut être employée avec succès pour distinguer entre différents usages des mots dans la traduction des requêtes pour la recherche d’information translinguistique. Les expérmentations sont entreprises dans le contexte de la recherche d’information translinguistique amhariquefrancais. Des expérmentations sont entreprises qui comparent la performance de la collection des termes des requêtes désambiguïsés et non désambiguïsés contre une collection de documents ordonnés. Les résultats montrent une amélioration de performance pour les requêtes désambiguïsées en comparison avec l’approche alternative qui emploie la collection de termes entièrement expansés.

Abstract : We show that Mutual Information between word pairs can be successfully used to discriminate between word senses in the query translation step of Cross Language Information Retrieval. The experiment is conducted in the context of Amharic to French Cross Language Information Retrieval. We have performed a number of retrieval experiments in which we compare the performance of the sense discriminated and non-discriminated set of query terms against a ranked document collection. The results show an increased performance for the discriminated queries compared to the alternative approach, which uses the fully expanded set of terms.

Mots clés : recherche d’information, désambiguïsation des mots, information mutuelle, amharique

Keywords : information retrieval, word sense discrimination, mutual information, amharic