talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Alignement de termes de longueur variable en corpus comparables spécialisés

Jingshu Liu, Emmanuel Morin, Sebastián Peña Saldarriaga

Résumé : Nous proposons dans cet article une adaptation de l’approche compositionnelle étendue capable d’aligner des termes de longueurs variables à partir de corpus comparables, en modifiant la représentation des termes complexes. Nous proposons également de nouveaux modes de pondération pour l’approche standard qui améliorent les résultats des approches état de l’art pour les termes simples et complexes en domaine de spécialité.

Mots clés : Multilinguisme, alignement, corpus comparables, vecteur de contexte.