talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Predicting CEFR writing levels from writing process and linguistic features: a cross-corpus comparison

Ahood Al Sawar, Thomas Gaillat, Nicolas Ballier

Abstract : Cet article analyse un ensemble de métriques conçues pour caractériser le comportement des apprenants d'anglais, leurs processus d'écriture et les caractéristiques linguistiques de leurs productions écrites finales. Il explore également si les motifs/patrons observés dans ces métriques peuvent être utilisés pour prédire la maîtrise de l'anglais des apprenants en termes de niveaux du CECR (Cadre européen commun de référence pour les langues). Nous appliquons cette méthode à deux jeux de données, KUPA-KEYS et un corpus en cours de constitution dans le cadre d'un projet qui intègre l'analyse des traces numériques claviers dans une perspective de learning analytics.

Keywords : Analytique de l'apprentissage, Traces numériques clavier, Métriques prédictives, Jets textuels, Corpus d'apprenants, processus d'écriture