talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Inbenta Semantic Clustering : un outil de classification non-supervisée hybride

Manon Quintana, Laurie Planes

Résumé : Inbenta développe un outil de classification non-supervisée hybride qui allie à la fois les statistiques et la puissance de notre lexique inspiré de la Théorie Sens-Texte. Nous présenterons ici le contexte qui a amené à la nécessité de développer un tel outil. Après un rapide état de l’art sur la classification non-supervisée en TAL, nous décrirons le fonctionnement de notre clustering sémantique.

Mots clés : classification non-supervisée, sémantique, théorie Sens-Texte, fonctions lexicales, statistique, K-medoïdes