Utilisabilité d'une ressource propriétaire riche dans le cadre de la classification de documents
Baptiste Chardon, Louis Saint-Maxent, Patrick Séguéla
Résumé : Dans ce papier, nous nous intéressons à l’utilisation d’une ressource linguistique propriétaire riche pour une tâche de classification. L'objectif est ici de mesurer l'impact de l'ajout de ces ressources sur cette tâche en termes de performances. Nous montrons que l’utilisation de cette ressource en temps que traits supplémentaires de classification apporte un réel avantage pour un ajout très modéré en termes de nombre de traits.
Abstract : In this paper, we focus on the use of a proprietary resource for a document classification task. The objective is here to measure the impact of the addition of this resource as input for classification features. We show that the use of this resource impacts positively the classification results, for a limited impact on the feature number.
Mots clés : classification de documents, classification automatique, ressources
Keywords : document level classification, automatic classification, resources