talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Classification d’apprenants francophones de l’anglais sur la base des métriques de complexité lexicale et syntaxique

Nicolas Ballier, Thomas Gaillat

Résumé : Cette contribution examine les monologues en oral spontané du corpus ANGLISH (Tortel 2009). Les productions orales de vingt locuteurs natifs sont comparées aux monologues produits par les quarante locuteurs francophones de niveau intermédiaire et avancé. Les métriques de complexité syntaxique et lexicale implémentées dans des analyseurs (Lu 2014) sont utilisées pour essayer de classer les locuteurs. Enfin, à partir des courbes de croissance du vocabulaire et des modèles LNRE (Baayen 2008), on cherche à évaluer la pertinence de ces métriques de l’écrit pour la classification des locuteurs en fonction de leur production orale.

Mots clés : complexité lexicale, complexité syntaxique, métriques d‘apprenants, modèles LNRE