AutoCluster: Un agent pour le clustering basé sur les grands modèles de langue
Erwan Versmée, Youcef Remil, Mehdi Kaytoue, Julien Velcin
Résumé : Cette recherche présente AutoCluster, un agent basé sur les grands modèles de langue pour des tâches de classification non supervisée. Nous concevons trois agents dont deux sont basés sur la littérature et l'un, AutoCluster, est une contribution originale. Une analyse détaillée de leur performance sur 26 jeux de données de clustering révèle la supériorité de notre agent par rapport aux solutions de l'état de l'art. Enfin, nous justifions l'efficacité de notre agent à travers les nombreuses améliorations empiriques apportées au fur et à mesure de son développement.
Mots clés : Agent basé sur les LLMs, clustering, science des données, ReAct, appel d'outils