talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Indexation et appariements de documents cliniques pour le Deft 2019

Davide Buscaldi, Dhaou Ghoul, Joseph Le Roux, Gaël Lejeune

Résumé : Dans cet article, nous présentons nos méthodes pour les tâches d’indexation et d’appariements du Défi Fouile de Textes (Deft) 2019. Pour la taĉhe d’indexation nous avons testé deux méthodes, une fondée sur l’appariemetn préalable des documents du jeu de tset avec les documents du jeu d’entraînement et une autre méthode fondée sur l’annotation terminologique. Ces méthodes ont malheureusement offert des résultats assez faible. Pour la tâche d’appariement, nous avons dévellopé une méthode sans apprentissage fondée sur des similarités de chaînes de caractères ainsi qu’une méthode exploitant des réseaux siamois. Là encore les résultats ont été plutôt décevant même si la méthode non supervisée atteint un score plutôt honorable pour une méthode non-supervisée : 62% .

Mots clés : Appariement, Indexation, Réseaux Siamois, MESH, Modèles en Caractères.