talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Annotation d'interactions hôte-microbiote dans des articles scientifiques par similarité sémantique avec une ontologie

Oumaima El Khettari, Solen Quiniou, Samuel Chaffron

Résumé : Nous nous intéressons à l'extraction de relations, dans des articles scientifiques, portant sur le microbiome humain. Afin de construire un corpus annoté, nous avons évalué l'utilisation de l'ontologie OHMI pour détecter les relations présentes dans les phrases des articles scientifiques, en calculant la similarité sémantique entre les relations définies dans l'ontologie et les phrases des articles. Le modèle BERT et trois variantes biomédicales sont utilisés pour obtenir les représentations des relations et des phrases. Ces modèles sont comparés sur un corpus construit à partir d'articles scientifiques complets issus de la plateforme ISTEX, dont une sous-partie a été annotée manuellement.

Mots clés : Extraction d'information dans les textes scientifiques, tableaux, figures, bibliographie, Reconnaissance d'entités nommées dans les textes scientifiques