talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Expériences d'étiquetage morphosyntaxique dans le cadre du projet RESTAURE

Pierre Magistry, Anne-Laure Ligozat, Sophie Rosset

Résumé : Le projet RESTAURE vise à outiller en outils TAL trois langues régionales de France : l’alsacien, l’occitan et le picard. Dans cet article, nous abordons la question de l’étiquetage morphosyntaxique et rapportons les performances de différents systèmes proposés dans la littérature. Notre objectif est d’aborder les trois langues de manière homogène afin de pouvoir comparer les méthodes dans la variété de situations que présentent nos données. Ces expériences doivent guider notre réflexion pour le développement d’outils semisupervisés.

Mots clés : étiquetage morphosyntaxique, langues peu dotées.