@inproceedings{Zuo-Gerdes-Villemonte-de-la-Clergerie-Sagot:CORIA-TALN-2026:2026,
    author = "Zuo, You and Gerdes, Kim and Villemonte de la Clergerie, \'Eric and Sagot, Beno{\^\i}t",
    title = "Sparse Coverage : repr\'esentations par centres s\'emantiques pour la recherche de brevets",
    booktitle = "Actes de CORIA-TALN 2026. Actes de la 21e Conf\'erence en Recherche d'Information et Applications.  Volume 1 : articles scientifiques originaux",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "173-195",
    note = "",
    abstract = "La recherche d{\textquoteright}ant\'eriorit\'e dans les brevets est une t\^ache orient\'ee vers le rappel, portant sur des documents techniques longs et fortement structur\'es. La recherche dense am\'eliore l{\textquoteright}appariement s\'emantique, mais les repr\'esentations \`a vecteur unique peuvent comprimer plusieurs composants, fonctions et contraintes techniques dans un seul embedding. Nous proposons Sparse Coverage, un cadre non supervis\'e de recherche s\'emantique qui projette des embeddings locaux de segments textuels vers un vocabulaire creux de centres dans l{\textquoteright}espace des embeddings. Ces centres sont s\'electionn\'es au moyen d{\textquoteright}un objectif k-center orient\'e vers la couverture, et les segments activent les centres voisins afin de produire des repr\'esentations creuses compatibles avec la recherche par index invers\'e. Les exp\'eriences men\'ees sur CLEF-IP 2013 montrent que Sparse Coverage atteint ou d\'epasse, dans plusieurs configurations, le rappel au niveau document de puissants encodeurs denses de brevets, tout en restant comp\'etitif pour la recherche au niveau passage. En combinant des indices s\'emantiques locaux avec une recherche creuse par index invers\'e, Sparse Coverage constitue une approche efficace pour la premi\`ere \'etape de la recherche de brevets.",
    keywords = "repr\'esentation de documents, brevets, recherche d{\textquoteright}ant\'eriorit\'es, recherche creuse",
    url = "30029.pdf"
}
