talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un outil d’étiquetage rapide et un corpus libre en entités nommées du Français

Yoann Dupont

Résumé : Dans cet article, nous présentons un outil pour effectuer l’étiquetage rapide de textes bruts. Il peut charger des documents annotés depuis divers formats, notamment BRAT et GATE. Il se base sur des raccourcis claviers intuitifs et la diffusion d’annotation à l’échelle du document. Il permet d’entraîner des systèmes par apprentissage que l’on peut alors utiliser pour préannoter les textes.

Mots clés : étiquetage, entités nommées, corpus, annotation structurée, GUI.