@inproceedings{Casanova-Knecht-Girault-Klotzer-Launay-Sebillot-amsaleg-Gravier:CORIA-TALN-2026:2026,
    author = {Casanova, Morgane and Knecht, Amelie and Girault, Thomas and Kl\"otzer, Victor and Launay, Tanguy and Sebillot, Pascale and amsaleg, laurent and Gravier, Guillaume},
    title = "Un retour d'exp\'eriences sur l'adaptation de mod\`eles de langue \`a la presse r\'egionale : connaissance n'est pas comp\'etence !",
    booktitle = "Actes de CORIA-TALN 2026. Actes des 33\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles.  Volume 1 : articles scientifiques originaux",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "621-633",
    note = "",
    abstract = "Nous pr\'esentons une \'etude sur l'adaptation de mod\`eles de langue (ML) g\'en\'eralistes \`a la presse r\'egionale. En particulier, nous nous
int\'eressons aux faits et relations sp\'ecifiques au journal appris lors de l'adaptation du ML et \`a l'impact sur des t\^aches classiques. Nous analysons les cons\'equences de l'adaptation du vocabulaire et de la poursuite du pr\'e-entra{\^\i}nement pour deux mod\`eles bidirectionnels
r\'ecents et mettons en \'evidence que ces deux \'etapes permettent de mieux capturer les sp\'ecificit\'es du journal et d'acqu\'erir des
connaissances. Nous \'evaluons ensuite l'impact sur diff\'erentes t\^aches canoniques montrent que l'adaptation des ML n'am\'eliore pas les performances sur nos t\^aches, en dehors du cas o\`u les donn\'ees d'apprentissage sont fortement limit\'ees.",
    keywords = "mod\`eles de langue, adaptation de vocabulaire, pr\'e-apprentissage continu, acquisition de connaissance, classification, entit\'es nomm\'ees, recherche d{\textquoteright}information",
    url = "49.pdf"
}
