@inproceedings{Mdhaffar-Elleuch-Chellaf-Bouziane-Nguyen-Esteve:CORIA-TALN-2026:2026,
    author = "Mdhaffar, Salima and Elleuch, Haroun and Chellaf, Chaimae and Bouziane, Maryem and Nguyen, Ha and Est\`eve, Yannick",
    title = "Mod\`ele SENSE : une solution open source pour les t\^aches multilingues et multimodales bas\'ees sur la s\'emantique",
    booktitle = "Actes de CORIA-TALN 2026. Actes des 33\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles.  Volume 2 : articles d\'ej\`a publi\'es",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "33-34",
    note = "",
    abstract = "Cet article pr\'esente SENSE (Shared Embedding for N-lingual Speech and tExt), une solution open source inspir\'ee du cadre SAMU-XLSR et conceptuellement proche des mod\`eles SONAR de Meta AI.
Ces approches reposent sur un cadre teacher{\textendash}student visant \`a aligner un encodeur de parole auto-supervis\'e avec les repr\'esentations continues ind\'ependantes de la langue produites par un encodeur de texte, au niveau de l{\textquoteright}\'enonc\'e.
Nous d\'ecrivons comment la m\'ethode originale SAMU-XLSR a \'et\'e am\'elior\'ee en s\'electionnant un mod\`ele texte enseignant plus performant ainsi qu{\textquoteright}un meilleur encodeur de parole initial.
Le code source permettant d{\textquoteright}entra{\^\i}ner et d{\textquoteright}utiliser les mod\`eles SENSE a \'et\'e int\'egr\'e dans l'outil SpeechBrain, et le premier mod\`ele SENSE que nous avons entra{\^\i}n\'e a \'et\'e rendu public.
Nous pr\'esentons des r\'esultats exp\'erimentaux sur des t\^aches s\'emantiques multilingues et multimodales, dans lesquelles notre mod\`ele SENSE atteint des performances tr\`es comp\'etitives.
Enfin, cette \'etude apporte de nouveaux \'eclairages sur la mani\`ere dont la s\'emantique est captur\'ee dans ce type d{\textquoteright}encodeurs de parole align\'es s\'emantiquement.",
    keywords = "Encodeur de parole multilingue, repr\'esentation s\'emantique, recherche d{\textquoteright}information multimodale, traduction de la parole",
    url = "56.pdf"
}
