MuSeD : un dataset multimodal en espagnol pour la détection du sexisme dans les vidéos sur les réseaux sociaux
Laura De Grazia, Pol Pastells, Mauro Vázquez Chas, Desmond Elliott, Danae Sanchez Villegas, Mireia Farrús, Mariona Taulé Delor
Résumé : Le sexisme est une forme de discrimination systémique dont la diffusion est amplifiée par les réseaux sociaux, notamment à travers les vidéos. Sa détection automatique est complexe car elle nécessite d’intégrer des signaux verbaux, sonores et visuels. Dans cette étude : (1) nous introduisons MuSeD, un corpus multimodal en espagnol pour la détection du sexisme (≈11 heures de vidéos collectées sur TikTok et BitChute) ; (2) nous proposons un cadre d’annotation analysant l’apport des modalités textuelles, vocales et visuelles à la classification du sexisme ; (3) nous évaluons plusieurs grands modèles de langage (LLMs), unimodaux et multimodaux, sur cette tâche. Nos résultats indiquent que la modalité visuelle est déterminante pour identifier le sexisme. Si les modèles obtiennent de bonnes performances pour les formes explicites, leurs performances diminuent pour les cas implicites (les stéréotypes) où l’accord inter-annotateurs est plus faible. Cela souligne la complexité de la tâche, dépendante du contexte socioculturel.
Mots clés : détection du sexisme, analyse multimodale, jeu de données, vidéos des réseaux sociaux, annotation, accord inter-annotateurs, sexisme implicite, modèles de langage, modèles de langage multimodaux