talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Modélisation et analyse des coordinations elliptiques par l’exploitation dynamique des forêts de dérivation

Djamé Seddah, Benoît Sagot

Résumé : Nous présentons dans cet article une approche générale pour la modélisation et l’analyse syntaxique des coordinations elliptiques. Nous montrons que les lexèmes élidés peuvent être remplacés, au cours de l’analyse, par des informations qui proviennent de l’autre membre de la coordination, utilisé comme guide au niveau des dérivations. De plus, nous montrons comment cette approche peut être effectivement mise en oeuvre par une légère extension des Grammaires d’Arbres Adjoints Lexicalisées (LTAG) à travers une opération dite de fusion. Nous décrivons les algorithmes de dérivation nécessaires pour l’analyse de constructions coordonnées pouvant comporter un nombre quelconque d’ellipses.

Abstract : In this paper, we introduce a generic approach to elliptic coordination modelization and parsing.We show that the erased lexical items can be replaced during parsing, by information gathered from the other member of the coordination, used as a guide at the derivation level. Moreover, we show how this approach can indeed be implemented as a light extension of the LTAG formalism through a fusion operation.We provide the derivation algorithms required to parse coordination constructions which can have an arbitrary number of elisions.

Mots clés : analyse syntaxique, TAG, coordination, ellipses, forêt partagée, forêt de dérivation

Keywords : parsing, TAG, coordination, ellipsis, shared forest, derivation forest