@inproceedings{Remaki-Gerardin-Farre-Maduell-Krallinger-Tannier:CORIA-TALN-2026:2026,
    author = "Remaki, Adam and G\'erardin, Christel and Farr\'e-Maduell, Eul\`alia and Krallinger, Martin and Tannier, Xavier",
    title = "Compl\'eter des annotations humaines par des donn\'ees synth\'etiques pour l{\textquoteright}alignement d{\textquoteright}entit\'es biom\'edicales",
    booktitle = "Actes de CORIA-TALN 2026. Actes des 33\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles.  Volume 2 : articles d\'ej\`a publi\'es",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "6-6",
    note = "",
    abstract = "Nous pr\'esentons SynCABEL, une m\'ethode visant \`a r\'eduire la d\'ependance aux annotations manuelles n\'ecessaires \`a l{\textquoteright}apprentissage supervis\'e de l{\textquoteright}alignement d{\textquoteright}entit\'es biom\'edicales, en les compl\'etant par des exemples synth\'etiques. SynCABEL exploite des LLMs pour g\'en\'erer des exemples d{\textquoteright}entra{\^\i}nement riches en contexte couvrant l{\textquoteright}ensemble des concepts candidats d{\textquoteright}une base de connaissances cible, offrant ainsi une supervision plus large. En utilisant des mod\`eles g\'en\'eratifs r\'ecents et une inf\'erence guid\'ee, notre approche \'etablit de nouveaux \'etats de l{\textquoteright}art sur trois jeux de donn\'ees de r\'ef\'erence : MedMentions (anglais), QUAERO (fran\c{c}ais) et SPACCC (espagnol). En faisant varier la quantit\'e de donn\'ees annot\'ees manuellement disponibles, SynCABEL atteint des performances comparables \`a un entra{\^\i}nement enti\`erement supervis\'e tout en r\'eduisant jusqu{\textquoteright}\`a 60\\% le volume d{\textquoteright}annotations humaines n\'ecessaires. Enfin, nous introduisons un protocole d{\textquoteright}\'evaluation fond\'e sur un LLM-as-a-judge, qui montre que SynCABEL augmente la proportion de pr\'edictions cliniquement valides.",
    keywords = "Alignement d{\textquoteright}Entit\'es Biom\'edicales,Augmentation de Donn\'ees,Fouille de Textes",
    url = "3.pdf"
}
