talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

SuperGPQA-HCE-FR : un corpus spécialisé en français pour le domaine hydraulique et le génie civil

Markarit Vartampetian, Diandra Fabre, Philippe Mulhem, Sylvain Joubert, Didier Schwab

Résumé : Dans cet article, nous présentons SuperGPQA-HCE-FR, une adaptation française d’un sous-ensemble du benchmark SuperGPQA axé sur les domaines de l’ingénierie hydraulique et du génie civil. Il comprend 285 questions à choix multiples conçues pour évaluer et spécialiser des modèles de langue multilingues de grande taille (LLMs) sur des tâches techniques. La traduction réalisée automatiquement est ensuite évaluée par des experts des domaines. Enfin, nous présentons les premiers résultats sur des modèles Instruct généralistes multilingues en comparant les performances du corpus original en anglais à celles du corpus traduit en français.

Mots clés : LLM, corpus spécialisé, français, évaluation, ingénierie hydraulique, génie civil