talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

ding-01 :ARG0 Un corpus AMR pour le français parlé spontané

Jeongwoo Kang, Maria Boritchev, Maximin Coavoux

Résumé : Nous présentons notre travail en cours sur l'annotation d'un corpus sémantique du français. Nous annotons le corpus DinG, constitué de transcriptions de dialogues spontanés en français enregistrées pendant des parties du jeu de plateau Catan , en Abstract Meaning Representation (AMR), un formalisme de représentation sémantique. Comme AMR a une couverture insuffisante de la dynamique de la parole spontanée, nous étendons le formalisme pour mieux représenter la parole spontanée et les structures de phrases spécifiques au français. En outre, nous diffusons un guide d'annotation détaillant ces extensions. Enfin, nous publions notre corpus sous licence libre (CC-SA-BY). Notre travail contribue au développement de ressources sémantiques pour le dialogue en français.

Mots clés : Annotation, sémantique, AMR, parole, corpus.