Biais de confirmation, de cadrage et de position dans les LLMs

Liana Ermakova, Anton Firsov, Jaap Kamps

Résumé : Les LLMs présentent des capacités remarquables de génération et de raisonnement, mais leurs productions reflètent souvent des biais cognitifs systématiques analogues à ceux observés dans le jugement humain. Cet article examine trois formes de biais interdépendantes : le biais de confirmation, le biais de position et le biais de cadrage. À travers une série d'expériences de prompting contrôlées des LLMs ouverts (Qwen, Mistral, Gemma, Olmo et LLaMA), nous montrons que les LLMs ont tendance à renforcer les prémisses intégrées dans les requêtes des utilisateurs (biais de confirmation), à favoriser les éléments initiaux ou saillants d'un prompt (biais de position), et à modifier leurs conclusions selon que l'entrée est formulée de manière positive ou négative (biais de cadrage). Nos résultats peuvent contribuer à améliorer les pratiques d'ingénierie de prompt, à renforcer les protocoles d'évaluation et à soutenir un usage responsable des LLM dans l'enseignement, la recherche et la prise de décision.

Mots clés : LLM, biais de confirmation, biais de position, biais de cadrage

Téléchargement :
[article]
[bibtex]

talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Biais de confirmation, de cadrage et de position dans les LLMs

Liana Ermakova, Anton Firsov, Jaap Kamps