Cartographie lexicale pour la recherche d'information
Jean Véronis
Résumé : Nous décrivons un algorithme, HyperLex, de détermination automatique des différents usages dun mot dans une base textuelle sans utilisation dun dictionnaire. Cet algorithme basé sur la détection des composantes de forte densité du graphe des cooccurrences de mots permet, contrairement aux méthodes précédemment proposées (vecteurs de mots), disoler des usages très peu fréquents. Il est associé à une technique de représentation graphique permettant à lutilisateur de naviguer de façon visuelle à travers le lexique et dexplorer les différentes thématiques correspondant aux usages discriminés.
Abstract : We describe the HyperLex algorithm for automatic discrimination of word uses in a textual database. The algorithm does not require a dictionary. It detects high density components in the word-cooccurrence graph, and, contrary to previous methods (word vectors), enables the recognition of very low frequency uses. HyperLex is associated with a graphic representation technique that makes it possible to navigate through the lexicon and explore visually the various themes corresponding to the discriminated uses.
Mots clés : Désambiguïsation lexicale, recherche dinformation, interfaces graphiques
Keywords : Lexical disambiguation, information retrieval, graphic interfaces