DiaTAC-Emo : Dialecte Tunisien - Analyse à deux niveaux pour la Classification des Émotions
Latifa Iben Nasr, Ismail Badache, Abir Masmoudi, Lamia Belguith
Résumé : Les émotions dans la parole spontanée sont authentiques mais se chevauchent souvent, en particulier dans les langues peu dotées comme le dialecte tunisien (DT), qui présente des caractéristiques linguistiques spécifiques. Nous proposons une méthode adaptative qui combine l’analyse des émotions au niveau du document et au niveau des aspects afin de mieux capturer ce chevauchement granulaire. En utilisant des transcriptions issues à la fois de modèles open source et propriétaires, nous appliquons GPT-4o pour l’augmentation des données avec une validation humaine. Gemini 1.5 Flash est utilisé pour l’extraction des aspects, soutenue par une validation humaine et une auto-validation avec injection de contexte. Pour la reconnaissance des émotions à partir de la parole (Speech Emotion Recognition : SER), des modèles préentraînés en arabe ainsi que des LLMs sont évalués ; AraBERT obtient les meilleures performances, avec une exactitude de 77% au niveau du document et de 79,8% au niveau des aspects. Les résultats soulignent l’importance de la qualité de la transcription, du choix des modèles et de l’analyse au niveau des aspects pour la SER dans les langues sous-représentées.
Mots clés : Reconnaissance des émotions, Transcription, Dialecte tunisien, Niveau du document, Niveau de l'aspect