@inproceedings{Thirion-Sen:CORIA-TALN-2026:2026,
    author = "Thirion Sen, Shami",
    title = "D\'etection de l{\textquoteright}h\'et\'erog\'en\'eit\'e des messages et leur corr\'elation avec les profils d{\textquoteright}auteurs sur les r\'eseaux sociaux",
    booktitle = "Actes de CORIA-TALN 2026. Actes des 19e Rencontres Jeunes Chercheurs en RI (RJCRI) et 28\`eme Rencontre des \'Etudiants Chercheurs  en Informatique pour le Traitement Automatique des Langues (RECITAL)",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "134-150",
    note = "",
    abstract = "Les r\'eseaux sociaux tels que X (ex-Twitter) sont des plateformes incontournables de discussions
des sujets sociaux et politiques. Dans la continuit\'e d{\textquoteright}\'etudes ayant d\'emontr\'e l{\textquoteright}h\'et\'erog\'en\'eit\'e des
id\'eologies au sein d{\textquoteright}un m\^eme mouvement politique, nous examinons un jeu de donn\'ees comportant
7373 messages avec le slogan {\guillemotleft} Nicolas qui paie {\guillemotright} issus de X sur les manifestations du 10 septembre
2025 en France. Notre objectif est de d\'etecter l{\textquoteright}h\'et\'erog\'en\'eit\'e des messages publi\'es ainsi que leurs
corr\'elations avec diff\'erents profils d{\textquoteright}auteurs, identifi\'es via leurs biographies. Nous adoptons une
approche non supervis\'ee reposant sur la vectorisation et le clustering des messages, suivie d{\textquoteright}une
extraction des termes les plus sp\'ecifiques des clusters selon la m\'ethodologie de Lafon et d{\textquoteright}une
annotation des clusters \`a l{\textquoteright}aide du grand mod\`ele de langue Claude 3.7 Sonnet. Nos premiers r\'esultats
r\'ev\`elent qu{\textquoteright}une forte homog\'en\'eit\'e des messages s\'electionn\'es entrave la d\'etection de corr\'elations
entre les types de messages et les profils d{\textquoteright}auteurs les ayant publi\'es.",
    keywords = "R\'eseaux sociaux, d\'etection d{\textquoteright}h\'et\'erog\'en\'eit\'e des donn\'ees, analyse des profils d{\textquoteright}utilisateurs, apprentissage non supervis\'e, clustering, annotation par LLM.",
    url = "20018.pdf"
}
