talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Traitement de la polysémie lexicale dans un but de traduction

Marianna Apidianaki

Résumé : La désambiguïsation lexicale a une place centrale dans les applications de Traitement Automatique des Langues relatives à la traduction. Le travail présenté ici fait partie d’une étude sur les recouvrements et les divergences entre les espaces sémantiques occupés par des unités polysémiques de deux langues. Les correspondances entre ces unités sont rarement biunivoques et l’étude de ces correspondances aide à tirer des conclusions sur les possibilités et les limites d’utilisation d’une autre langue pour la désambiguïsation des unités d’une langue source. Le but de ce travail est l’établissement de correspondances d’une granularité optimale entre les unités de deux langues entretenant des relations de traduction. Ces correspondances seraient utilisables pour la prédiction des équivalents de traduction les plus adéquats de nouvelles occurrences des éléments polysémiques.

Abstract : Word Sense Disambiguation has a central role in NLP applications relevant to translation. The work presented in this article is a part of a study on the overlaps and divergences between the semantic spaces occupied by the polysemous items of two languages. Correspondences between these items are rarely biunivocal and their study provides insights into the possibilities and limits of using a second language for the disambiguation of polysemous items of a source language. The aim of this work is to establish correspondences of optimal granularity between the items of two languages in translation. Such correspondences could be used for the prediction of the most adequate translation equivalents for new occurrences of the polysemous source language items.

Mots clés : polysémie, cooccurrences, correspondances de traduction, prédiction de traduction

Keywords : polysemy, cooccurrences, translation correspondences, translation prediction