Oui mais... ChatGPT peut-il identifier des entités dans des documents historiques ?

Carlos-Emiliano González-Gallardo, Emanuela Boros, Nancy Girdhar, Ahmed Hamdi, Jose Moreno, Antoine Doucet

Résumé : Les modèles de langage de grande taille (LLM) sont exploités depuis plusieurs années maintenant, obtenant des performances de pointe dans la reconnaissance d'entités à partir de documents modernes. Depuis quelques mois, l'agent conversationnel ChatGPT a suscité beaucoup d'intérêt auprès de la communauté scientifique et du grand public en raison de sa capacité à générer des réponses plausibles. Dans cet article, nous explorons cette compétence à travers la tâche de reconnaissance et de classification d'entités nommées (NERC) dans des sources primaires (des journaux historiques et des commentaires classiques) d'une manière zero-shot et en la comparant avec les systèmes de pointe basés sur des modèles de langage. Nos résultats indiquent plusieurs lacunes dans l'identification des entités dans le texte historique, qui concernant la cohérence des guidelines d'annotation des entités, la complexité des entités et du changement de code et la spécificité du prompt. De plus, comme prévu, l'inaccessibilité des archives historiques a également un impact sur les performances de ChatGPT.

Mots clés : Reconnaissance et classification d'entités nommées, Modèles de langue de grande taille, Transformeur génératif préentraîné, Documents historiques

Téléchargement :
[article]
[bibtex]

talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Oui mais... ChatGPT peut-il identifier des entités dans des documents historiques ?

Carlos-Emiliano González-Gallardo, Emanuela Boros, Nancy Girdhar, Ahmed Hamdi, Jose Moreno, Antoine Doucet