talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Réutilisation de Textes dans les Manuscrits Anciens

Amir Hazem, Béatrice Daille

Résumé : Nous nous intéressons dans cet article à la problématique de réutilisation de textes dans les livres liturgiques du Moyen Âge. Plus particulièrement, nous étudions les variations textuelles de la prière Obsecro Te souvent présente dans les livres d’heures. L’observation manuelle de 772 copies de l’Obsecro Te a montré l’existence de plus de 21 000 variantes textuelles. Dans le but de pouvoir les extraire automatiquement et les catégoriser, nous proposons dans un premier temps une classification lexico-sémantique au niveau n-grammes de mots pour ensuite rendre compte des performances de plusieurs approches état-de-l’art d’appariement automatique de variantes textuelles de l’Obsecro Te.

Mots clés : Obsecro Te, Livres d’heures, Réutilisation de textes, Variantes textuelles.