@inproceedings{Dubois-Yvon-Piantanida:CORIA-TALN-2026:2026,
    author = "Dubois, Matthieu and Yvon, Fran\c{c}ois and Piantanida, Pablo",
    title = "L'impact de l'\'echantillonnage sur la d\'etectabilit\'e des textes r\'edig\'es par une IA",
    booktitle = "Actes de CORIA-TALN 2026. Actes des 33\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles.  Volume 2 : articles d\'ej\`a publi\'es",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "23-23",
    note = "",
    abstract = "Les textes g\'en\'er\'es par les grands mod\`eles de langage (LLM) \'etant souvent indiscernables des \'ecrits humains, leur d\'etection automatique suscite aujourd{\textquoteright}hui un int\'er\^et croissant. Bien que de nombreux d\'etecteurs r\'ecents affichent une pr\'ecision quasi parfaite (avec des scores AUROC d\'epassant 99{\textbackslash}\\%), ces performances reposent g\'en\'eralement sur des param\`etres de g\'en\'eration fixes. Cela soul\`eve la question de leur robustesse face aux diff\'erentes strat\'egies de d\'ecodage. Dans cette \'etude, nous analysons l'impact du d\'ecodage par \'echantillonnage sur la d\'etectabilit\'e, en observant comment d'infimes variations dans la distribution des (sous-)mots affectent les r\'esultats. Nous montrons que des ajustements mineurs (temp\'erature, top-p ou nucleus) peuvent s\'ev\`erement d\'egrader la pr\'ecision, l'AUROC chutant parfois jusqu'\`a 1{\textbackslash}\\%. Nos conclusions mettent en lumi\`ere les failles des m\'ethodes actuelles et soulignent le besoin d'\'evaluations plus rigoureuses. Nous publions nos r\'esultats et donn\'ees https://github.com/BaggerOfWords/Sampling-and-Detection.",
    keywords = "G\'en\'eration de Textes, D\'etection de textes artificiels, Th\'eorie de l{\textquoteright}information",
    url = "86.pdf"
}
