@inproceedings{Noel-Asher-Gouvert-Benamara-Hunter:CORIA-TALN-2026:2026,
    author = "Noel, Charlotte and Asher, Nicholas and Gouvert, Olivier and Benamara, Farah and Hunter, Julie",
    title = "EIFFEL: Un corpus d{\textquoteright}expressions idiomatiques fran\c{c}aises pour \'evaluer les biais anglocentriques des GLMs",
    booktitle = "Actes de CORIA-TALN 2026. Actes des 33\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles.  Volume 2 : articles d\'ej\`a publi\'es",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "14-14",
    note = "",
    abstract = "Les GLMs multilingues populaires sont g\'en\'eralement entra{\^\i}n\'es sur de plus grande proportions de donn\'ees anglaises que de donn\'ees multilingues, ce qui soul\`eve des questions quant \`a leur capacit\'e \`a saisir les particularit\'es linguistiques propres \`a ces autres langues ainsi qu'\`a saisir leurs informations culturelles sp\'ecifiques. Nous contribuons ainsi \`a un effort visant \`a accro{\^\i}tre la sensibilit\'e multilingue des GLMs en d\'eveloppant un benchmark, EIFFEL, qui teste la ma{\^\i}trise des expressions idiomatiques fran\c{c}aises en contexte.  Nous d\'etaillons la m\'ethodologie employ\'ee, incluant la participation de locuteurs natifs fran\c{c}ais, afin de la rendre reproductible dans d'autres langues. Nous comparons les GLMs multilingues populaires aux GLMs ax\'es sur le fran\c{c}ais \`a la fois sur des benchmarks standards et sur EIFFEL. EIFFEL met en \'evidence les avantages d'une proportion plus \'elev\'ee de donn\'ees en fran\c{c}ais et montre les limites des benchmarks standards pour mesurer le multilinguisme.",
    keywords = "\'evaluation multilingue, benchmarks multilingues, construction de corpus, ressources de langage, corpus multilingue, jeu de donn\'ees TAL, crosslingual transfert",
    url = "71.pdf"
}