talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un analyseur discriminant de la famille LR pour l’analyse en constituants

Benoît Crabbé

Résumé : On propose un algorithme original d’analyse syntaxique déterministe en constituants pour le langage naturel inspiré de LR (Knuth, 1965). L’algorithme s’appuie sur un modèle d’apprentissage discriminant pour réaliser la désambiguisation (Collins, 2002). On montre que le modèle discriminant permet de capturer plus finement de l’information morphologique présente dans les données, ce qui lui permet d’obtenir des résultats état de l’art en temps comme en exactitude pour l’analyse syntaxique du français.

Abstract : We provide a new weighted parsing algorithm for deterministic context free grammar parsing inspired by LR (Knuth, 1965). The parser is weighted by a discriminative model that allows determinism (Collins, 2002).We show that the discriminative model allows to take advantage of morphological information available in the data, hence allowing to achieve state of the art results both in time and in accurracy for parsing French.

Mots clés : Analyse guidée par les têtes, analyse LR, temps linéaire, modèle discriminant, inférence approximative

Keywords : Head driven parsing, LR parsing, linear time, discriminative modelling, approximate inference