talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Vers l'annotation par le jeu de corpus (plus) complexes : le cas de la langue de spécialité

Karën Fort, Bruno Guillaume, Nicolas Lefebvre, Laura Ramírez, Mathilde Regnault, Mary Collins, Oksana Gavrilova, Tanti Kristanti

Résumé : Nous avons précédemment montré qu’il est possible de faire produire des annotations syntaxiques de qualité par des participants à un jeu ayant un but. Nous présentons ici les résultats d’une expérience visant à évaluer leur production sur un corpus plus complexe, en langue de spécialité, en l’occurrence un corpus de textes scientifiques sur l’ADN. Nous déterminons précisément la complexité de ce corpus, puis nous évaluons les annotations en syntaxe de dépendances produites par les joueurs par rapport à une référence mise au point par des experts du domaine.

Mots clés : annotation en syntaxe de dépendances, crowdsourcing, jeux ayant un but.