talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Désambiguïsation par proximité structurelle

Bruno Gaume, Nabil Hathout, Philippe Muller

Résumé : L’article présente une méthode de désambiguïsation dans laquelle le sens est déterminé en utilisant un dictionnaire. La méthode est basée sur un algorithme qui calcule une distance « sémantique » entre les mots du dictionnaire en prenant en compte la topologie complète du dictionnaire, vu comme un graphe sur ses entrées. Nous l’avons testée sur la désambiguïsation des définitions du dictionnaire elles-mêmes. L’article présente des résultats préliminaires, qui sont très encourageants pour une méthode ne nécessitant pas de corpus annoté.

Abstract : This paper presents a disambiguation method in which word senses are determined using a dictionary. We use a semantic proximity measure between words in the dictionary, taking into account the whole topology of the dictionary, seen as a graph on its entries. We have tested the method on the problem of disambiguation of the dictionary entries themselves, with promising results considering we do not use any prior annotated data.

Mots clés : Désambiguïsation sémantique, réseaux petits mondes hiérarchiques, dictionnaires

Keywords : Word sense desambiguation, hierarchical small words, dictionaries