talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Influence de la qualité de l’étiquetage sur le chunking : une corrélation dépendant de la taille des chunks

Philippe Blache, Stéphane Rauzy

Résumé : Nous montrons dans cet article qu’il existe une corrélation étroite existant entre la qualité de l’étiquetage morpho-syntaxique et les performances des chunkers. Cette corrélation devient linéaire lorsque la taille des chunks est limitée. Nous appuyons notre démonstration sur la base d’une expérimentation conduite suite à la campagne d’évaluation Passage 2007 (de la Clergerie et al., 2008). Nous analysons pour cela les comportements de deux analyseurs ayant participé à cette campagne. L’interprétation des résultats montre que la tâche de chunking, lorsqu’elle vise des chunks courts, peut être assimilée à une tâche de “super-étiquetage”.

Abstract : We show in this paper that a strong correlation exists between the performance of chunk parsers and the quality of the tagging task in input. This dependency becomes linear when the size of the chunks is small. Our demonstration is based on an experiment conducted at the end of the Passage 2007 shared task evaluation initiative (de la Clergerie et al., 2008). The performance of two parsers which took part in this evaluation has been investigated. The results indicate that the chunking task, for sufficiently short chunks, is similar to a super-tagging task.

Mots clés : Analyse syntaxique, étiquetage morphosyntaxique, analyseur stochastique, analyseur symbolique superficiel, chunker

Keywords : Parsing, tagging, stochastic parser, symbolic shallow parser, chunker