talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Désambiguïsation lexicale automatique : sélection automatique d’indices

Laurent Audibert

Résumé : Nous exposons dans cet article une expérience de sélection automatique des indices du contexte pour la désambiguïsation lexicale automatique. Notre point de vue est qu’il est plus judicieux de privilégier la pertinence des indices du contexte plutôt que la sophistication des algorithmes de désambiguïsation utilisés. La sélection automatique des indices par le biais d’un algorithme génétique améliore significativement les résultats obtenus dans nos expériences précédentes tout en confortant des observations que nous avions faites sur la nature et la répartition des indices les plus pertinents.

Abstract : This article describes an experiment on automatic features selection for word sense disambiguation. Our point of view is that word sense disambiguation success is more dependent on the features used to represent the context in which an ambiguous word occurs than on the sophistication of the learning techniques used. Automatic features selection using a genetic algorithm improves significantly our last experiment bests results and is consistent with the observations we have made on the nature and space distribution of the most reliable features.

Mots clés : désambiguïsation lexicale automatique, corpus sémantiquement étiqueté, cooccurrences, sélection d’indices, algorithmes génétiques

Keywords : word sense disambiguation, sense tagged corpora, cooccurrences, features selection, genetic algorithms