talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Sylva : plate-forme de validation multi-niveaux de lexiques

Karën Fort, Bruno Guillaume

Résumé : La production de lexiques est une activité indispensable mais complexe, qui nécessite, quelle que soit la méthode de création utilisée (acquisition automatique ou manuelle), une validation humaine. Nous proposons dans ce but une plate-forme Web librement disponible, appelée Sylva (Systematic lexicon validator). Cette plate-forme a pour caractéristiques principales de permettre une validation multi-niveaux (par des validateurs, puis un expert) et une traçabilité de la ressource. La tâche de l’expert(e) linguiste en est allégée puisqu’il ne lui reste à considérer que les données sur lesquelles il n’y a pas d’accord inter-validateurs.

Abstract : Lexicon production is essential but complex and all creation methods (automatic acquisition or manual creation) require human validation. For this purpose, we propose a freely available Web-based framework, named Sylva (Systematic lexicon validator). The main point of our framework is that it handles multi-level validations and keeps track of the resource’s history. The expert linguist task is made easier : (s)he has only to consider data on which validators disagree.

Mots clés : Lexiques, plate-forme de validation, cadres de sous-catégorisation

Keywords : Lexicons, validation framework, subcategorization frames