talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Prédiction des pauses dans les données d’écriture en temps réel

Ioana-Madalina Silai, Iris Eshkol-Taravella, Kehina Manseri

Résumé : Cette étude explore la prédiction des pauses dans des données d’écriture enregistrées en temps réel. Deux hypothèses sont testées : (1) les pauses dépendent du contenu lexical des bursts, et (2) les catégories morpho-syntaxiques (POS) influencent leur distribution. Après prétraitement linguistique, plusieurs techniques de classification sont testées. CamemBERT atteint jusqu’à 90 % de précision en classification binaire, suggérant un lien fort entre structure linguistique et pauses.

Mots clés : séquences d’écriture pauses écriture en temps réel segmentation automatique prediction automatique