talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Impact de l'affinage de modèles génératifs pour l'inférence en langue naturelle appliquée aux essais cliniques : comparaison avec des approches de *few-shot learning*

Lounès Kebdi, Lubin Longuépée, Mathilde Aguiar, Pierre Zweigenbaum, Nona Naderi

Résumé : Les grands modèles de langue (LLM) ont atteint des résultats compétitifs dans de nombreuses applications, y compris dans des domaines de spécialité tels que le biomédical. Dans les essais cliniques, l’inférence en langue naturelle (ILN) permet de modéliser certaines tâches telles que le recrutement de patients. Dans cette étude, nous comparons l’affinage et l’apprentissage en contexte avec peu d’exemples afin d’améliorer les performances des LLM pour l’ILN appliquée aux essais cliniques. Nous utilisons les jeux de données NLI4CT et NLI4PR portant sur l’ILN dans le domaine clinique. Nos résultats démontrent que l’affinage des LLM surpasse les autres approches pour les deux jeux de données. Cependant, la différence de performance entre affinage et apprentissage avec peu d’exemples reste parfois faible, en particulier lorsque l’on optimise la sélection des exemples.

Mots clés : Inférence en langue naturelle, Grands Modèles de Langage, essais cliniques, affinage, apprentissage avec peu d'exemples