talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

La traduction du point de vue de l’Information Bottleneck : une analyse d’efficience des prépositions spatiales dans des bitextes

Antoine Taroni, Ludovic Moncla, Frederique Laforest

Résumé : Une communication efficiente requiert un équilibre entre informativité et simplicité. L'Information Bottleneck (IB) formalise ce compromis en termes de théorie de l'information. Bien que ce cadre soit largement étayé dans des domaines visuels (couleurs, mouvement), l'étude de stimuli linguistiques comme des mots en contexte phrastique reste inexplorée. Nous proposons dans cet article une nouvelle méthodologie computationnelle comblant cette lacune, en dressant un parallèle entre le processus de traduction, et la question d'optimisation au sens de l'IB. Nous avons appliqué cette méthodologie aux prépositions spatiales de bitextes français, anglais, allemands et serbes. Une étude pilote de tri de cartes (N=35) nous a permis de prédire l'informativité des traductions de prépositions. Les résultats suggèrent que les traductions authentiques sont plus efficientes que des variantes hypothétiques. Plus largement, nous proposons d'exploiter les données de traduction afin d'étudier les pressions cognitives qui façonnent les systèmes sémantiques naturels et artificiels.

Mots clés : Théorie de l’Information, Langage Spatial, Cognition Spatiale, Information Bottle- neck, Efficience du Langage, Traduction