@inproceedings{Fretel-Louis-Cecconi:CORIA-TALN-2026:2026,
    author = "Fretel, Liza and Louis, Corentin and Cecconi, Baptiste",
    title = "\'Evaluation de m\'ethodes d{\textquoteright}attribution de mots-cl\'es standardis\'es \`a des r\'esum\'es d{\textquoteright}articles d{\textquoteright}h\'eliophysique",
    booktitle = "Actes de CORIA-TALN 2026. Actes de l'atelier Analyse et Recherche de Textes Scientifiques (ARTS)@TALN 2026",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "63-76",
    note = "",
    abstract = "Cette \'etude s'int\'eresse \`a l'attribution de mots-cl\'es issus des concepts de l'Unified Astronomy Thesaurus (UAT) \`a partir de titres et r\'esum\'es d'articles dans le domaine astrophysique. Elle soul\`eve des probl\'ematiques de classification multi-label extr\^eme car les labels sont tr\`es \'epars (2411 labels possibles pour moins de dix labels positifs) et d'un manque de donn\'ees d'entra{\^\i}nement qualitatives. Plusieurs m\'ethodologies ont \'et\'e \'evalu\'ees : application du mod\`ele KAILAS sur nos donn\'ees ; entra{\^\i}nement d'un vectoriseur TF-IDF suivi d'une r\'egression lin\'eaire ; vectorisation des champs textuels des concepts UAT avec AstroBERT ; entra{\^\i}nement d'une architecture R-GCN{\textasciitilde}; correspondance de cha{\^\i}ne de caract\`eres. Pour ces exp\'eriences, nous avons collect\'e un corpus de 34 025 r\'esum\'es d'articles d'astrophysique. 5 361 de ces articles contenaient au moins un mot-cl\'e sous le concept d'h\'eliophysique. Nous avons aussi utilis\'e un petit corpus (31 documents) de r\'esum\'es d'articles pr\'epubli\'es dans notre sous-domaine d'int\'er\^et (l'h\'eliophysique) qui ont manuellement \'et\'e annot\'es avec des mots-cl\'es. Sur le corpus ADS h\'eliophysique, KAILAS a obtenu le meilleur score F1 atteignant 0.5453 (contre 0.5006 pour le TF-IDF avec r\'egression lin\'eaire), et le TF-IDF avec r\'egression lin\'eaire a obtenu un score F1 de 0.6612 sur les pr\'epublications d'h\'eliophysique, contre 0.3612 pour KAILAS.",
    keywords = "classification multi-labels extr\^eme, suggestion de mots-cl\'es, astrophysique",
    url = "1.pdf"
}
