talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Détection d'anomalies textuelles à base de l'ingénierie d'invite

Yizhou Xu, Kata Gábor, Leila Khouas, Frédérique Segond

Résumé : La détection d’anomalies textuelles est une tâche importante de la fouille de textes. Plusieurs approches générales, visant l’identification de points de données aberrants, ont été appliqués dans ce domaine. Néanmoins, ces approches exploitent peu les nouvelles avancées du traitement automatique des langues naturelles (TALN). L’avènement des modèles de langage pré-entraînés comme BERT et GPT-2 a donné naissance à un nouveau paradigme de l’apprentissage automatique appelé ingénierie d’invite (prompt engineering) qui a montré de bonnes performances sur plusieurs tâches du TALN. Cet article présente un travail exploratoire visant à examiner la possibilité de détecter des anomalies textuelles à l’aide de l’ingénierie d’invite. Dans nos expérimentations, nous avons examiné la performance de différents modèles d’invite. Les résultats ont montré que l’ingénierie d’invite est une méthode prometteuse pour la détection d’anomalies textuelles.

Mots clés : Détection d’anomalies textuelles, Ingénierie d’invite, Modèle de langage pré- entraîné, GPT-2.