Evaluation de la lisibilité des textes biomédicaux selon le profil du lecteur
Anya Nait Djoudi
Résumé : La lisibilité des textes biomédicaux est perçue différemment selon le profil du lecteur, ce qui est amplifié par la complexité intrinsèque de ces documents et par l’inégale littératie en santé au sein de la population. Bien que 72% des internautes consultent des informations médicales en ligne, une part significative rencontre des difficultés de compréhension. Pour garantir l’accessibilité des textes à un public varié, l’évaluation de la lisibilité est donc essentielle. Or, les formules de lisibilité classiques, conçues pour des textes généraux, ne tiennent pas compte de cette diversité, soulignant la nécessité d’adapter les outils d’évaluation aux besoins spécifiques des textes biomédicaux et à l’hétérogénéité des lecteurs. Pour répondre à ce besoin, nous avons développé une méthode d’évaluation automatique de la lisibilité, adaptée à trois profils de lecteurs (adultes experts/non-experts, enfants). Cette méthode s’appuie sur un corpus biomédical bilingue de 20 008 documents (11 154 en anglais, 8 854 en français), que nous avons constitué et rendons accessible librement. Elle utilise une architecture hybride combinant embeddings de transformers et caractéristiques linguistiques, atteignant un score F1 macro-moyen de 0,987. Cette approche ouvre des perspectives pour l’évaluation fine de la lisibilité, la personnalisation de la recherche d’information, et la validation de la lisibilité des résumés générés automatiquement.
Mots clés : lisibilité, accessibilité, transformers, caractéristiques linguistiques, texte biomédical