talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Quand les Bots Déjouent l'Apprentissage : Enjeux et Défis de la Détection

Mohsine Aabid, Patrice Bellot, Simon Dumas Primbault

Résumé : Identifier les bots d'une une bibliothèque numérique est un défi crucial pour analyser avec précision le comportement des utilisateurs afin de mieux répondre à leurs besoins. Mais que se passe-t-il lorsque les modèles de détection sont confrontés à des données provenant d'une période différente de leur période d'entraînement ? Cet article explore cette question en extrayant des caractéristiques clés, telles que la durée de l'activité et le nombre de requêtes, nous comparons plusieurs modèles d'apprentissage supervisé et évaluons la robustesse de cette approche face aux variations temporelles. Nos observations préliminaires montrent que les modèles de détection tendent à être plus confiant sur les données issues de leur période d'entraînement, ce qui soulève des questions sur leur capacité à généraliser à des périodes différentes. Cette dépendance met en lumière la nécessité de stratégies adaptatives, telles que des mises à jour régulières des modèles et de nouvelles approches d'apprentissage, afin de saisir l'évolution des comportements automatisés et améliorer la robustesse de la détection.

Mots clés : Détection des bots, Apprentissage supervisé, Filtrage des sessions, Internet, Bibliothèque numérique.