talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

LIZARD, un assistant pour le développement de ressources linguistiques à base de cascades de transducteurs

Antonio Balvet

Résumé : Nous présentons un outil visant à assister les développeurs de ressources linguistiques en automatisant la fouille de corpus. Cet outil, est guidé par les principes de l’analyse distributionnelle sur corpus spécialisés, étendue grâce à des ressources lexicales génériques. Nous présentons une évaluation du gain de performances dû à l’intégration de notre outil à une application de filtrage d’information et nous élargissons le champ d’application de l’assistant aux études sur corpus menées à l’aide de cascades de transducteurs à états finis.

Abstract : We present a tool providing linguistic resources developers with automated corpus analysis features. Our tool implements specialized corpora distributional analysis principles, extended by the integration of external generic lexical resources. We present an evaluation of the gain in performance attributable to our tool, for a text filtering task. We also widen our tool’s scope of applications to transducer cascades-based corpus processing activities.

Mots clés : TALN, assistant linguistique, ressources linguistiques, agents autonomes, études sur corpus

Keywords : NLP, linguistic wizard, linguistic resources, autonomous agents, corpus-based studies