talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Alignement Bilingue des Résumés et des Mots-Clés de these.fr

Ziqian Peng, Lichao Zhu, Maxime Bouthors, François Yvon

Résumé : Les développements récents des systèmes de traduction automatique, en particulier l'utilisation de grands modèles de langue exploitant des longs contextes, des exemples et des informations terminologiques, ont conduit à améliorer l'utilisabilité des textes cibles générés automatiquement. Pour accompagner l'utilisation de tels systèmes pour des documents scientifiques, nous documentons dans cette contribution nos efforts pour construire des ressources pour la TA de documents académiques à partir des méta-données de these.fr.

Mots clés : Alignement de Phrases, Alignement de Mots-Clés, Corpus Académiques Bilingues