talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Couplage d’un étiqueteur morpho-syntaxique et d’un analyseur partiel représentés sous la forme d’automates finis pondérés

Alexis Nasr, Alexandra Volanschi

Résumé : Cet article présente une manière d’intégrer un étiqueteur morpho-syntaxique et un analyseur partiel. Cette integration permet de corriger des erreurs effectuées par l’étiqueteur seul. L’étiqueteur et l’analyseur ont été réalisés sous la forme d’automates pondérés. Des résultats sur un corpus du français ont montré une dimintion du taux d’erreur de l’ordre de 12%.

Abstract : This paper presents a method of integrating a part-of-speech tagger and a chunker. This integration lead to the correction of a number of errors made by the tagger when used alone. Both tagger and chunker are implemented as weighted finite state machines. Experiments on a French corpus showed a decrease of the word error rate of about 12%.

Mots clés : Analyse morpho-syntaxique, analyse syntaxique partielle, automates finis pondérés

Keywords : Part-of-speech tagging, chunking, weighted finite state machines