talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Computer Tools for the Management of Lexicon-Grammar Databases

Javier M. Sastre Martínez

Résumé : Le lexique grammaire est une méthode systématique d’analyse et de représentation des structures de phrase élémentaire d’une langue naturelle ; son produit : des grandes collections de dictionnaires syntaxiques électroniques ou tables de lexique-grammaire (LGTs). Du travail collaboratif à très long terme est nécessaire pour achever la description d’une langue. Cependant, les outils informatiques de gestion de LGTs actuels ne remplissent pas les besoins suivant : intégration automatique de données multisource, controle de cohérence de données et de versions, filtrage et tri, formats d’échange, gestion couplée des données et de la documentation, interfaces graphiques (GUIs) dédiées et gestion d’utilisateurs et contrôle d’accès. Dans cet article nous proposons une solution basée sur PostgreSQL et/ou MySQL (systèmes de gestion de bases de données libres), Swing (une librairie pour la programmation de GUIs en Java), JDBC (API pour la connectivité de Java aux bases de données), et StAX (API pour l’analyse et la création des documents en XML).

Abstract : Lexicon grammar is a systematic method for the analysis and the representation of the elementary sentence structures of a natural language producing large collections of syntactic electronic dictionaries or lexicongrammar tables (LGTs). In order to describe a language, very long term collaborative work is required. However, the current computer tools for the management of LGTs do not fulfill key requirements including automatic integration of multisource data, data coherence and version control, filtering and sorting, exchange formats, coupled management of data and documentation, dedicated graphical interfaces (GUIs) and user management and access control. In this paper we propose a solution based on PostgreSQL and/or MySQL (open source database management systems), Swing (a GUI toolkit for Java), JDBC (the API for Java database connectivity) and StAX (an API for the analysis and generation of XML documents).

Mots clés : table de lexique-grammaire, base de données, interface graphique, XML

Keywords : Lexicon-grammar table, database, graphic interface, XML