talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Participation du CRIM à DEFT 2024 : Utilisation de petits modèles de Langue pour des QCMs dans le domaine médical

Ahmed Moubtahij, Charles-William Cummings, Azur Handan, Edith Galy, Eric Charton

Résumé : Ce papier décrit le travail de l'équipe du CRIM (Centre de recherche en Informatique de Montréal) dans le cadre du Défi Fouille de textes 2024. Nous présentons les expériences que nous avons menées dans le cadre de la tâche principale consistant à identifier automatiquement, pour une question donnée issue d'annales d'examens de pharmacie, l'ensemble des réponses correctes parmi les cinq proposées. La contrainte est d'utiliser un système de moins de 3 milliards de paramètres dont les données d'entraînement sont connues. Pour ce faire, nous avons testé des approches impliquant du few-shot prompting, du RAG, de l'affinage et de la génération contrainte en dernier recours.

Mots clés : LLM, few-shot prompting, RAG, génération contrainte en dernier recours