talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Analyse des contextes et des candidats dans l'identification des équivalents terminologiques en corpus comparables

Audrey Laroche

Résumé : L’approche standard d’identification d’équivalents terminologiques à partir de corpus comparables repose sur la comparaison de mots contextuels en langues source et cible et sur l’utilisation d’un lexique bilingue. Nous analysons manuellement, selon des critères linguistiques (parties du discours, spécificité et relations sémantiques), les propriétés des mots contextuels et des erreurs commises par l’approche standard appliquée à la terminologie médicale pour suggérer des améliorations basées sur la sélection de mots contextuels.

Abstract : The standard approach for identifying terminological equivalents from comparable corpora is based on the comparison of source and target language context words using a bilingual lexicon. We cary a manual analysis of the linguistic properties (parts of speech, specificity and semantic relations) of the context words and the inacurrate equivalents given by the standard approach applied to medical terminology, in order to suggest improvements based on the selection of context words.

Mots clés : équivalents terminologiques, vecteurs contextuels, corpus comparables, terminologie médicale, étude qualitative

Keywords : terminological equivalents, contextual vectors, comparable corpora, medical terminology, qualitative study.