@inproceedings{Zong-Vast-Van-Cooten-Soulier-Piwowarski:CORIA-TALN-2026:2026,
    author = "Zong, Yuxuan and Vast, Mathias and Van Cooten, Basile and Soulier, Laure and Piwowarski, Benjamin",
    title = "Tokens ou Concepts ? Exploration de l{\textquoteright}utilisation des autoencodeurs clairsem\'es pour SPLADE",
    booktitle = "Actes de CORIA-TALN 2026. Actes de la 21e Conf\'erence en Recherche d'Information et Applications.  Volume 1 : articles scientifiques originaux",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "30-53",
    note = "",
    abstract = "Les mod\`eles de RI neuronaux parcimonieux, tels que SPLADE, offrent un excellent compromis entre efficacit\'e et performance. Cependant, ils reposent sur le vocabulaire du mod\`ele de base, ce qui peut nuire aux performances (polys\'emie et synonymie) et poser des d\'efis pour les usages multilingues et multimodaux. Pour y rem\'edier, nous proposons de remplacer le vocabulaire du mod\`ele de base par un espace latent de concepts s\'emantiques appris \`a l{\textquoteright}aide d{\textquoteright}auto-encodeurs parcimonieux, ou SAE.
Dans cet article, nous \'etudions la compatibilit\'e de ces deux concepts et montrons que SAE-SPLADE atteint des performances comparables \`a celles de SPLADE, \`a la fois sur des t\^aches dans le domaine et hors domaine, tout en offrant une meilleure efficacit\'e.",
    keywords = "Recherche d'Information, Mod\'eles de RI neuronaux parcimonieux, SPLADE, Auto-Encodeur Parcimonieux",
    url = "30017.pdf"
}
