talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

SAGACE-v3.3 ; Analyseur de corpus pour langues non flexionnelles

Blin Raoul

Résumé : Nous présentons la dernière version du logiciel SAGACE, analyseur de corpus pour langues faiblement flexionnelles (par exemple japonais ou chinois). Ce logiciel est distribué avec un lexique où les catégories sont exprimées à l'aide de systèmes de traits.

Abstract : We present a software program named SAGACE, designed to search for and extract word strings from a large corpus. It has been conceived for poor flexional languages, such as Japanese or Chinese. It is associated with a lexicon where categories are expressed with feature systems.

Mots clés : corpus, lexique, analyseur, japonais, chinois

Keywords : corpus, lexicon, analyzer, japanese, chinese