talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Inférence grammaticale guidée par clustering

Noémie-Fleur Sandillon-Rezer

Résumé : Dans cet article, nous nous focalisons sur la manière d’utiliser du clustering hiérarchique pour apprendre une grammaire AB à partir d’arbres de dérivation partiels. Nous décrirons brièvement les grammaires AB ainsi que les arbres de dérivation dont nous nous servons comme entrée pour l’algorithme, puis la manière dont nous extrayons les informations des corpus arborés pour l’étape de clustering. L’algorithme d’unification, dont le pivot est le cluster, sera décrit et les résultats analysés en détails.

Abstract : In this article, we describe the way we use hierarchical clustering to learn an AB grammar from partial derivation trees. We describe AB grammars and the derivation trees we use as input for the clustering, then the way we extract information from Treebanks for the clustering. The unification algorithm, based on the information extracted from our cluster, will be explained and the results discussed.

Mots clés : grammaires catégorielles, clustering hiérarchique, inférence grammaticale

Keywords : categorial grammars, hierarchical clustering, grammatical inference