talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

MemLabor, un environnement de création, de gestion et de manipulation de corpus de textes

Vincent Perlerin

Résumé : Nous présentons dans cet article un logiciel d’étude permettant la création, la gestion et la manipulation de corpus de textes. Ce logiciel appelé MemLabor se veut un outil ouvert et open-source adaptable à toutes les opérations possibles que l’on peut effectuer sur ce type de matériau. Dans une première partie, nous présenterons les principes généraux de l’outil. Dans une seconde, nous en proposerons une utilisation dans le cadre d’une acquisition supervisée de classes sémantiques.

Abstract : In this article, we present a study software that allows creation, management and handling of corpora. This software called MemLabor is an open-source program, adaptable to all operations that we can carry out on this type of material. In the first part of this article, we will present the main principles of this tool. In the second part, we will suggest one of it use within the framework of a semantic classes supervised acquisition.

Mots clés : analyse de corpus, acquisition supervisée de terminologie, sémantique lexicale

Keywords : corpus analysis, supervised terminology acquisition, lexical semantics