talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Outiller une langue peu dotée grâce au TALN : l’exemple du corse et BDLC

Laurent Kevers, Florian Guéniot, A. Ghjacumina Tognotti, Stella Retali-Medori

Résumé : Nos recherches sur la langue corse nous amènent naturellement à envisager l’utilisation d’outils pour le traitement automatique du langage. Après une brève introduction sur le corse et sur le projet qui constitue notre cadre de travail, nous proposons un état des lieux concernant l’application du TAL aux langues peu dotées, dont le corse. Nous définissons ensuite les actions qui peuvent être entreprises, ainsi que la manière dont elles peuvent s’intégrer dans le cadre de notre projet, afin de progresser vers la constitution de ressources et la construction d’outils pour le TAL corse.

Mots clés : langues peu dotées, corse, ressources linguistiques, lemmatisation, POS.