talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Enrichissement du FTB : un treebank hybride constituants/propriétés

Philippe Blache, Stéphane Rauzy

Résumé : Cet article présente les mécanismes de création d’un treebank hybride enrichissant le FTB à l’aide d’annotations dans le formalisme des Grammaires de Propriétés. Ce processus consiste à acquérir une grammaire GP à partir du treebank source et générer automatiquement les structures syntaxiques dans le formalisme cible en s’appuyant sur la spécification d’un schéma d’encodage adapté. Le résultat produit, en partant d’une version du FTB corrigée et modifiée en fonction de nos besoins, constitue une ressource ouvrant de nouvelles perspectives pour le traitement et la description du français.

Abstract : We present in this paper the hybridation of the French Treebank with Property Grammars annotations. This process consists in acquiring a PG grammar from the source treebank and generating the new syntactic encoding on top of the original one. The result is a new resource for French, opening the way to new tools and descriptions.

Mots clés : Treebank hybride, French Treebank, Grammaires de Propriétés

Keywords : Hybrid treebank, French Treebank, Property Grammars