talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Détection automatique des unités linguistiques permettant le maintien de la producton écrite

Quentin Feltgen, Gaëtanelle Gilquin

Résumé : La production textuelle est segmentée par des pauses en jets textuels de longueur variable, interprétés comme manifestant une certaine cohérence cognitive dans la rédaction. Pour favoriser la fluence de ce processus, les scripteurs peuvent avoir recours à des unités linguistiques qui permettent de maintenir le flux de la production. L'objectif de cette contribution est de proposer une méthode de TAL pour détecter automatiquement ces unités. Nous l'appliquons à un corpus d'apprenants écrit en anglais L2 et montrons, d'une part, que les unités de structuration du texte (connecteurs, etc.) opèrent souvent de manière isolée, et d'autre part que la production peut être maintenue par le recours à des stratégies de complémentation (syntagme prépositionnel, proposition infinitive) qui permettent d'élaborer à partir d'un contenu déjà en place.

Mots clés : données de keylogging, corpus d'apprenants, unités phraséologiques, jets textuels, fluence