De la génération libre à la génération contrôlée : étude de la stabilité des résumés juridiques
Marah Baccari
Résumé : Les documents juridiques sont souvent longs, complexes et rédigés dans un langage spécialisé. Leur synthèse exige non seulement une réduction du contenu, mais aussi une forte fiabilité factuelle et structurelle. Dans cet article, nous étudions des méthodologies contrôlées pour la synthèse structurée de longues décisions de la Cour suprême des États-Unis. Nous analysons des mécanismes visant à améliorer la robustesse des grands modèles de langage (LLMs). Nous évaluons une synthèse hiérarchique via des prompts, des stratégies de génération à enrichissement contextuel, ainsi qu’une génération agentique sous contraintes structurelles. Nous introduisons notamment une approche de raffinement intra-document et une approche fondée sur Pydantic permettant d’imposer explicitement une structure juridique prédéfinie lors de la génération. Les résultats montrent que les contraintes structurelles et la validation itérative améliorent l’alignement factuel et la conformité formelle.
Mots clés : Résumé automatique, Synthèse juridique, Génération à enrichissement contextuel, Génération contrôlée, IA agentique