Segmentation automatique d'un texte en rhèses
Victor Pineau, Constance Nin, Solen Quiniou, Béatrice Daille
Résumé : La segmentation d’un texte en rhèses, unités-membres signifiantes de la phrase, permet de fournir des adaptations de celui-ci pour faciliter la lecture aux personnes dyslexiques. Dans cet article, nous proposons une méthode d’identification automatique des rhèses basée sur un apprentissage supervisé à partir d’un corpus que nous avons annoté. Nous comparons celle-ci à l’identification manuelle ainsi qu’à l’utilisation d’outils et de concepts proches, tels que la segmentation d’un texte en chunks.
Mots clés : rhèse, chunk, apprentissage supervisé, dyslexie, guide d’annotation.