talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Omniprésents et anthropomorphisés : analyse lexico-syntaxique des discours sur les LLM

Clémentine Bleuze, Bruno Guillaume, Aurélie Névéol, Karën Fort

Résumé : Depuis quelques années, les grands modèles de langue (LLM) sont au cœur des discours médiatiques comme scientifiques. Ils sont à cette occasion régulièrement anthropomorphisés, c'est-à-dire, présentés comme ayant des capacités habituellement attribuées aux êtres humains. Dans cet article, nous souhaitons ouvrir une discussion sur les risques de telles pratiques, et appuyer l'importance d'une parole scientifique fiable portée par la communauté du Traitement Automatique des Langues (TAL). Pour illustrer notre propos, nous proposons une méthode de détection de l'anthropomorphisation basée sur des indices lexico-syntaxiques en français, que nous appliquons sur un corpus de 737 publications CORIA-JEP-TALN-RECITAL entre 2020 et 2025. Nos résultats mettent en évidence des formulations potentiellement anthropomorphisantes, bien que non majoritaires, auxquelles il convient de réfléchir collectivement. Quel discours scientifique souhaitons-nous, chercheurs et chercheuses en TAL, porter au sujet des grands modèles de langue ?

Mots clés : TAL pour le TAL, anthropomorphisation, grands modèles de langue