Biais de confirmation, de cadrage et de position dans les LLMs
Liana Ermakova, Anton Firsov, Jaap Kamps
Résumé : Les LLMs présentent des capacités remarquables de génération et de raisonnement, mais leurs productions reflètent souvent des biais cognitifs systématiques analogues à ceux observés dans le jugement humain. Cet article examine trois formes de biais interdépendantes : le biais de confirmation, le biais de position et le biais de cadrage. À travers une série d’expériences de prompting contrôlées des LLMs ouverts (Qwen, Mistral, Gemma, Olmo et LLaMA), nous montrons que les LLMs ont tendance à renforcer les prémisses intégrées dans les requêtes des utilisateurs (biais de confirmation), à favoriser les éléments initiaux ou saillants d’un prompt (biais de position), et à modifier leurs conclusions selon que l’entrée est formulée de manière positive ou négative (biais de cadrage). Nos résultats peuvent contribuer à améliorer les pratiques d’ingénierie de prompt, à renforcer les protocoles d’évaluation et à soutenir un usage responsable des LLM dans l’enseignement, la recherche et la prise de décision.
Mots clés : LLM, biais de confirmation, biais de position, biais de cadrage