talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Amélioration de la lisibilité de textes via l'utilisation de LLM

Baptiste Ramonda, Isabelle Ferrané, Julien Pinquier

Résumé : La lisibilité d'un texte est essentielle pour garantir un accès équitable à l'information. Cet article propose une méthodologie visant à simplifier des textes complexes tout en préservant leur sens. Un indice global de lisibilité a été défini en combinant plusieurs scores normalisés. Ensuite, une chaîne de traitement automatique, basée sur l'API de Gemini (LLM de Google), a généré des versions simplifiées des textes. Les résultats montrent une amélioration significative de la lisibilité, selon l'indice global et les critères spécifiques. Pour vérifier la conservation des idées clés, des résumés ont été extraits des versions initiales et simplifiées. Une mesure de la distance sémantique confirme que les concepts essentiels sont préservés. Cette approche prouve qu'il est possible d'automatiser efficacement la simplification textuelle tout en maintenant la cohérence et la pertinence des contenus, améliorant ainsi l'accessibilité de l'information.

Mots clés : Lisibilité de textes, Simplification de textes, LLM, Sémantique