Mesurer les inégalités de genre en ligne avec le genre grammatical : Une étude du subreddit r/france
Marie Flesch, Heather Burnett
Résumé : Cet article présente un système de détection du genre basé sur le genre grammatical, conçu pour le français, créé afin de mesurer les inégalités de genre dans les espaces francophones en ligne. Il décrit tout d'abord la création et le test du système, qui extrait le genre grammatical dans les expressions de type je suis depuis un lexique, sur un corpus étiqueté. Ensuite, il propose une étude de cas en deux parties, avec l'application du système sur un corpus de 11.8 millions de commentaires publiés sur r/france, le plus grand forum francophone de Reddit, suivie d'une étude des dynamiques de participation des femmes et des hommes dans cet espace. Cette recherche montre qu'un système de détection du genre simple, basé sur du pattern-matching, atteint une haute performance (précision de 96% dans le corpus test), et permet de dévoiler d'importantes inégalités de participation sur un forum francophone de premier plan.
Mots clés : genre grammatical