talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

L'écriture inclusive dans les invites des modèles de langue : une stratégie gagnant-gagnant

Fanny Ducel, Sayaka Sato, Lucie Escasain, Aurélie Névéol, Karën Fort, Pascal Gygax

Résumé : Beaucoup de langues, dont le français, sont flexionnelles et marquent grammaticalement le genre. De nombreuses expériences de psycholinguistique ont démontré que le genre grammatical impacte les représentations mentales. Ainsi, les formes grammaticales masculines, supposément génériques, créent des interprétations biaisées en faveur du masculin. En parallèle, les LLM deviennent omniprésents, bien qu’ils amplifient les biais de genre. Dans cette étude, nous examinons si le masculin grammatical est interprété de manière générique par les LLM, et si l’écriture inclusive réduit les biais de genre de ces systèmes. Cinq LLM sont utilisés pour générer des noms de célébrités en français. Les 44 100 textes générés contiennent davantage de noms de femmes et de personnes non-binaires lorsque les invites sont inclusives. Le masculin n'est pas interprété de façon générique et provoque de forts biais favorisant les hommes. Ainsi, l’écriture inclusive réduit les biais de genre à la fois pour les locuteur·ices et dans les textes générés.

Mots clés : biais, genre, modèle de langue, français, écriture inclusive, psycholinguistique