talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Vers un système générique de réécriture de graphes pour l’enrichissement de structures syntaxiques

Corentin Ribeyre

Résumé : Ce travail présente une nouvelle approche pour injecter des dépendances profondes (sujet des verbes à contrôle, partage du sujet en cas d’ellipses, ...) dans un corpus arboré présentant un schéma d’annotation surfacique et projectif. Nous nous appuyons sur un système de réécriture de graphes utilisant des techniques de programmation par contraintes pour produire des règles génériques qui s’appliquent aux phrases du corpus. Par ailleurs, nous testons la généricité des règles en utilisant des sorties de trois analyseurs syntaxiques différents, afin d’évaluer la dégradation exacte de l’application des règles sur des analyses syntaxiques prédites.

Abstract : This work aims to present a new approach for injecting deep dependencies (subject of control verbs, subject sharing in case of ellipsis, ...) into a surfacic and projective treebank. We use a graph rewriting system with constraint programming techniques for producing generic rules which can be easily applied to a treebank. Moreover, we are testing the genericity of our rules by using output of three different parsers to evaluate how the rules behave on predicted parse trees.

Mots clés : réécriture de graphes, évaluation de shéma d’annotations, parsing, analyse en syntaxe profonde

Keywords : graph rewriting system, annotation schemes evaluation, deep syntax parsing