talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Quels attributs discriminants pour une analyse syntaxique par classification de textes en langue arabe ?

Fériel Ben Fraj, Chiraz Ben Othmane Zribi, Mohamed Ben Ahmed

Résumé : Dans le cadre d’une approche déterministe et incrémentale d’analyse syntaxique par classification de textes en langue arabe, nous avons prévu de prendre en considération un ensemble varié d’attributs discriminants afin de mieux assister la procédure de classification dans ses prises de décisions à travers les différentes étapes d’analyse. Ainsi, en plus des attributs morpho-syntaxiques du mot en cours d’analyse et des informations contextuelles des mots l’avoisinant, nous avons ajouté des informations compositionnelles extraites du fragment de l’arbre syntaxique déjà construit lors de l’étape précédente de l’analyse en cours. Ce papier présente notre approche d’analyse syntaxique par classification et vise l’exposition d’une justification expérimentale de l’apport de chaque type d’attributs discriminants et spécialement ceux compositionnels dans ladite analyse syntaxique.

Abstract : For parsing Arabic texts in a deterministic and incremental classification approach, we suggest that varying discriminative attributes is helpful in disambiguation between structures to classify. That’s why; we consider morpho-syntactic information of the current analyzed word and its surrounding context. In addition, we add a new information type: the compositional one. It consists of the portion of the syntactic tree already constructed until the previous analysis step. In this paper, we expose our parsing approach with classification basis and we justify the utility of the different discriminative attributes and especially the compositional ones.

Mots clés : analyse syntaxique incrémentale, langue arabe, apprentissage automatique, classification, attributs discriminants

Keywords : incremental parsing, Arabic language, machine learning, classification, discriminative attributes