talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Démonstration de Kawâkib, outil permettant d’assurer le feedback entre grammaire et corpus arabe pour l’élaboration d’un modèle théorique

André Jaccarini, Christian Gaubert

Résumé : Kawâkib est un outil assurant le feedback entre corpus arabe et grammaire. Ce logiciel interactif en ligne démontre le bien fondé de la méthode de variation des grammaires arabes pour l'obtention de l'algorithme optimal tant au niveau de l'analyse morphologique, cruciale étant donnée la structure du système sémitique, que syntaxique ou dans le domaine de la recherche de critères pertinents et discriminants pour le filtrage des textes.

Abstract : Kawâkib is a tool allowing feedback between arabic corpus and grammar. As far as methodology is concerned, this interactive online software implements and illustrates the grammar variation method that aims to determine the optimal algorithm, either for morphology – which is essential in semitic languages - or for syntax. The software also permits the search for criteria for text filtering.

Mots clés : arabe, automates, analyseurs, opérateurs linguistiques, mots-outils, filtrage de corpus

Keywords : arabic, automata, parsers, lingistic operators, tool words, corpus filtering