@inproceedings{Hamdi-Boros-G-Moreno-Doucet:CORIA-TALN-2026:2026,
    author = "Hamdi, Ahmed and Boros, Emanuela and G Moreno, Jose and Doucet, Antoine",
    title = "Appariement de trames narratives : d\'epasser le chevauchement lexical en recherche d{\textquoteright}information",
    booktitle = "Actes de CORIA-TALN 2026. Actes de la 21e Conf\'erence en Recherche d'Information et Applications.  Volume 1 : articles scientifiques originaux",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "87-97",
    note = "",
    abstract = "Les mod\`eles de similarit\'e s\'emantique actuels, bien que performants sur les benchmarks standards, peinent \`a reconna{\^\i}tre l'\'equivalence narrative entre textes relatant une m\^eme histoire. 
Pour pallier cette limitation en recherche d'information orient\'ee narration, nous pr\'esentons une nouvelle ressource multilingue constitu\'ee de r\'esum\'es de films appari\'es, extraite automatiquement de Wikipedia. 
Ce jeu de donn\'ees permet un apprentissage supervis\'e \`a grande \'echelle de la similarit\'e narrative au-del\`a du simple chevauchement lexical. Nous l'exploitons pour fine-tuner des mod\`eles d'embeddings via un apprentissage contrastif et \'evaluons leur performance dans un syst\`eme de recherche d'information \`a deux \'etages (premier appel BM25 suivi d'un re-ranking). 
Nous comparons les mod\`eles en configuration zero-shot avec leurs versions fine-tun\'ees sur notre ressource, d\'emontrant l'apport de l'appariement narratif cross-lingue pour cette t\^ache.",
    keywords = "recherche d'information, narrative, appariement, r\'esum\'e de films, ressource",
    url = "30015.pdf"
}
