talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un segmenteur-étiqueteur et un chunker pour le français

Isabelle Tellier, Yoann Dupont, Arnaud Courmet

Résumé : Nous proposons une démonstration de deux programmes : un segmenteur-étiqueteur POS pour le français et un programme de parenthésage en “chunks” de textes préalablement traités par le programme précédent. Tous deux ont été appris à partir du French Tree Bank.

Abstract : We propose a demo of two softwares : a Segmenter-POS Labeller for French and a Chunker for texts treated by the first program. Both have been learned from the French Tree Bank.

Mots clés : étiquetage POS, chunking, apprentissage automatique, French Tree Bank, CRF

Keywords : POS tagging, chunking, Machine Learning, French Tree Bank, CRF