talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un étiqueteur en ligne du Français

Yoann Dupont, Clément Plancq

Résumé : Nous proposons ici une interface en ligne pour étiqueter des textes en français selon trois niveaux d'analyses : la morphosyntaxe, le chunking et la reconnaissance des entités nommées. L'interface se veut simple et les étiquetages réutilisables, ces derniers pouvant être exportés en différents formats.

Mots clés : Reconnaissance d'entités nommées,French Treebank,Apprentissage automatique,CRF,IHM,en ligne