talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Amélioration de la Classification d’Auteur par l'Apprentissage du Style Linguistique Personnalisé en Discours Oral

Soumaya Sabry, Gaël Dias, Mohamad Ghassany, Faten Chaieb Chakchouk, Mohammed Hasanuzzaman

Résumé : Le style linguistique personnalisé (SLP) constitue une manifestation de la synchronisation interpersonnelle et suscite un intérêt croissant en raison de son potentiel à renforcer le caractère humain des systèmes de traitement automatique des langues. Toutefois, peu de méthodes permettent de modéliser efficacement le style individuel dans le contexte du langage oral. Dans cet article, nous mettons en évidence l’importance du SLP à travers son application à la classification d’auteur, en proposant une approche intégrant explicitement l’information stylistique afin d’améliorer les performances. Nous incorporons le SLP dans des modèles transformeurs pré-entraînés selon deux stratégies : l’affinage supervisé avec la fonction de perte d'entropie croisée et l’apprentissage contrastif via une architecture siamoise. Nos résultats montrent que l’intégration du style linguistique oral personnalisé améliore significativement la précision de classification par rapport aux modèles ne prenant pas en compte les indices stylistiques, surpassant également les performances humaines.

Mots clés : Apprentissage de représentations, Apprentissage par transfert, Apprentissage profond, Traitement automatique du langage naturel, Style linguistique personnalisé