Prédiction des pauses dans les données d’écriture en temps réel
Ioana-Madalina Silai, Iris Eshkol-Taravella, Kehina Manseri
Résumé : Cette étude explore la prédiction des pauses dans des données d’écriture enregistrées en temps réel. Deux hypothèses sont testées : (1) les pauses dépendent du contenu lexical des bursts, et (2) les catégories morpho-syntaxiques (POS) influencent leur distribution. Après prétraitement linguistique, plusieurs techniques de classification sont testées. CamemBERT atteint jusqu’à 90 % de précision en classification binaire, suggérant un lien fort entre structure linguistique et pauses.
Mots clés : séquences d’écriture pauses écriture en temps réel segmentation automatique prediction automatique