talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Trois schémas d’annotation syntaxique en dépendance pour un même corpus de français oral : le cas de la macrosyntaxe

Kim Gerdes, Sylvain Kahane

Résumé : Nous présentons trois schémas d’annotation appliqués à un même corpus de français oral : Rhapsodie, Orféo et UD (Universal Dependencies). Les deux premiers sont diffusés et le troisième est en cours. Nous mettons ici l’accent sur la macrosyntaxe, c’est-à-dire sur les relations au sein d’un énoncé qui ne relèvent pas de la rection. Nous contrastons les trois schémas et proposons un quatrième schéma qui subsume les trois autres.

Mots clés : treebank en dépendance, macrosyntaxe, prénoyau, parenthétique, incise