talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Analyse de la continuité référentielle dans le corpus d'écrits scolaires français et italien Scolinter

Martina Barletta, Claude Ponton

Résumé : Cet article présente une étude sur la continuité référentielle dans des écrits scolaires en français et en italien, en s'appuyant sur le corpus Scolinter. L'objectif est d'analyser les mécanismes de cohérence textuelle à l'école primaire et de comparer les stratégies utilisées dans les deux langues à travers l'annotation et l'analyse des chaines de continuité référentielle. Une campagne d'annotation a été menée sur 150 textes par langue (CE1 et CE2), et le corpus de référence obtenu suite à l'adjudication a fait l'objet d'une analyse présentée ici. Les résultats montrent des différences notables. Par exemple, en français, les pronoms personnels sont privilégiés, tandis qu'en italien, l'anaphore zéro est plus fréquente. L'étude met également en évidence une tendance commune dans l'introduction des référents, souvent par des syntagmes nominaux indéfinis suivis d'une reprise pronominale. En revanche, la densité référentielle ne varie pas significativement entre les niveaux scolaires. Ces analyses apportent un éclairage sur le développement des compétences rédactionnelles et les spécificités linguistiques influençant la gestion de la référence dans chaque langue.

Mots clés : Cohérence textuelle, continuité référentielle, écrits scolaires, corpus annoté