talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Utilisabilité d'une ressource propriétaire riche dans le cadre de la classification de documents

Baptiste Chardon, Louis Saint-Maxent, Patrick Séguéla

Résumé : Dans ce papier, nous nous intéressons à l’utilisation d’une ressource linguistique propriétaire riche pour une tâche de classification. L'objectif est ici de mesurer l'impact de l'ajout de ces ressources sur cette tâche en termes de performances. Nous montrons que l’utilisation de cette ressource en temps que traits supplémentaires de classification apporte un réel avantage pour un ajout très modéré en termes de nombre de traits.

Abstract : In this paper, we focus on the use of a proprietary resource for a document classification task. The objective is here to measure the impact of the addition of this resource as input for classification features. We show that the use of this resource impacts positively the classification results, for a limited impact on the feature number.

Mots clés : classification de documents, classification automatique, ressources

Keywords : document level classification, automatic classification, resources