@inproceedings{Sewraj-Ermakova:CORIA-TALN-2026:2026,
    author = "Sewraj, Hreshvik and Ermakova, Liana",
    title = "La complaisance des LLMs dans les domaines de la sant\'e et du climat",
    booktitle = "Actes de CORIA-TALN 2026. Actes de l'atelier Analyse et Recherche de Textes Scientifiques (ARTS)@TALN 2026",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "89-107",
    note = "",
    abstract = "L'essor des grands mod\`eles de langage (LLMs) transforme profond\'ement la mani\`ere dont les utilisateurs acc\`edent \`a l'information scientifique. Ces mod\`eles peuvent cependant manifester un comportement de complaisance (sycophancy), adaptant leurs r\'eponses \`a la formulation des questions plut\^ot qu'au raisonnement factuel. Ce ph\'enom\`ene est particuli\`erement pr\'eoccupant en sant\'e et en climat, o\`u une r\'eponse incorrecte peut conduire l'utilisateur \`a adopter de fausses croyances. Nous adressons deux questions de recherche : RQ1 : les r\'eponses courtes des LLMs sont-elles coh\'erentes avec les explications qu'ils produisent dans des domaines factuels sensibles ? RQ2 : un LLM-as-a-judge permet-il de d\'etecter la complaisance de mani\`ere fiable par rapport \`a des annotations humaines ind\'ependantes ? Pour y r\'epondre, nous \'evaluons GPT-5.1 sur le dataset TREC Health Misinformation et le dataset Climate Fever, en utilisant Gemini{\textasciitilde}3 Flash Preview comme juge automatique. Nous proposons un protocole d'\'evaluation de la complaisance valid\'e par une annotation humaine ind\'ependante, atteignant un fort accord inter-annotateurs.",
    keywords = "complaisance, grands mod\`eles de langage, d\'esinformation m\'edicale, v\'erification de faits climatiques, LLM-as-judge",
    url = "10.pdf"
}
