@inproceedings{Hammal-Zweigenbaum-Corro:CORIA-TALN-2026:2026,
    author = "Hammal, Ayoub and Zweigenbaum, Pierre and Corro, Caio",
    title = "Un formalisme fond\'e sur des approximations du probl\`eme du sac \`a dos pour mod\'eliser l'alignement",
    booktitle = "Actes de CORIA-TALN 2026. Actes des 33\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles.  Volume 2 : articles d\'ej\`a publi\'es",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "50-50",
    note = "",
    abstract = "Des travaux ant\'erieurs ont conclu que la majeure partie des capacit\'es de g\'en\'eration des grands mod\`eles de langue ({\textbackslash}emph{large language models}, LLM) est apprise lors du pr\'e-entra{\^\i}nement. Cependant, les LLM n\'ecessitent une \'etape d'alignement suppl\'ementaire afin de satisfaire aux exigences des t\^aches cibles ainsi qu{\textquoteright}aux pr\'ef\'erences stylistiques, entre autres.
Avec la croissance du nombre de param\`etres des LLM,
le co\^ut computationnel des proc\'edures d{\textquoteright}alignement devient de plus en plus prohibitif.
Dans ce travail, nous proposons une nouvelle approche permettant d'\'eviter ces co\^uts gr\^ace \`a un alignement implicite du LLM lors de la g\'en\'eration.
Notre approche se fonde sur l'utilisation d'un petit LLM auxiliaire correctement align\'e \`a co\^ut bien moindre
et sur la construction d'un m\'elange des distributions de sortie des deux LLM.
Le calcul des param\`etres de la loi de m\'elange est r\'eduit \`a un probl\`eme de sac \`a dos binaire. Gr\^ace \`a ce formalisme, nous d\'erivons des approximations primales et duales de la loi de m\'elange optimale.
Nous montrons exp\'erimentalement les b\'en\'efices de notre m\'ethode, tant en termes de performance sur les t\^aches cibles que de vitesse de g\'en\'eration en utilisant un d\'ecodage sp\'eculatif.",
    keywords = "Grands mod\`eles de langue, probl\`eme du sac \`a dos, alignement de mod\`ele de langue",
    url = "74.pdf"
}
