Expériences d'étiquetage morphosyntaxique dans le cadre du projet RESTAURE
Pierre Magistry, Anne-Laure Ligozat, Sophie Rosset
Résumé : Le projet RESTAURE vise à outiller en outils TAL trois langues régionales de France : l’alsacien, l’occitan et le picard. Dans cet article, nous abordons la question de l’étiquetage morphosyntaxique et rapportons les performances de différents systèmes proposés dans la littérature. Notre objectif est d’aborder les trois langues de manière homogène afin de pouvoir comparer les méthodes dans la variété de situations que présentent nos données. Ces expériences doivent guider notre réflexion pour le développement d’outils semisupervisés.
Mots clés : étiquetage morphosyntaxique, langues peu dotées.