talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Induction d’une grammaire de propriétés à granularité variable à partir du treebank arabe ATB

Raja Bensalem Bahloul, Marwa Elkarwi

Résumé : Dans cet article, nous présentons une démarche pour l’induction d’une grammaire de propriétés (GP) arabe en utilisant le treebank ATB. Cette démarche se base sur deux principales étapes : (1) l’induction d’une grammaire hors contexte et (2) l’induction d’une GP par la génération automatique des relations qui peuvent exister entre les unités grammaticales décrites dans la CFG. Le produit obtenu constitue une ressource ouvrant de nouvelles perspectives pour la description et le traitement de la langue arabe.

Abstract : This paper presents an approach for building an Arabic property grammar using the treebank ATB. This approach consists in two main steps: (1) inducing a context-free grammar from a treebank and (2) inducing a property grammar. So, we acquire first a context-free grammar (CFG) from the source treebank and then, we induce the property grammar by generating automatically existing relations between grammatical units described in the CFG. The result is a new resource for Arabic, opening the way to new tools and descriptions.

Mots clés : Treebanks, langue arabe, grammaire hors-contexte, grammaires de propriétés

Keywords : Treebanks, Arabic language, context-free grammar, property grammars