talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Contextes multilingues alignés pour la désambiguïsation sémantique : une étude expérimentale

Boxing Chen, Meriam Haddara, Olivier Kraif, Grégoire Moreau de Montcheuil, Marc El-Bèze

Résumé : Cet article s'intéresse a la désambiguïsation sémantique d'unités lexicales alignées a travers un corpus multilingue. Nous appliquons une méthode automatique non supervisée basée sur la comparaison de réseaux sémantiques, et nous dégageons un critère permettant de déterminer a priori si 2 unités alignées ont une chance de se désambiguïser mutuellement. Enfin, nous développons une méthode fondée sur un apprentissage a partir de contextes bilingues. En appliquant ce critère afin de déterminer pour quelles unités l'information traductionnelle doit être prise en compte, nous obtenons une amélioration des résultats.

Abstract : This paper addresses the sense disambiguation of aligned words through a multilingual corpus. We apply an unsupervised disambiguation method using inter word net comparison. We study a criterion that allows to identify the cases for which disambiguation can take advantage of alignment. Finally, we implement a method based on a training stage using both monolingual and bilingual context, and we apply the previous criterion in order to select between monolingual or bilingual clues, showing some improvement of the results.

Mots clés : Désambiguïsation sémantique, alignement multilingue, lexique sémantique

Keywords : Word sense disambiguation, multilingual aligning, semantic lexicon