@inproceedings{Guembour:JEP-TALN:2024,
    author = "Guembour, Sami",
    title = "Analyse s\'emantique du corpus des Cahiers citoyens",
    booktitle = "Actes de JEP-TALN-RECITAL 2024. Actes de la 26\`eme Rencontre des \'Etudiants Chercheurs en Informatique  pour le Traitement Automatique des Langues",
    month = "7",
    year = "2024",
    address = "Toulouse, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "17-27",
    note = "",
    abstract = "Cet article pr\'esente une recherche originale qui se concentre sur une analyse s\'emantique du corpus des Cahiers citoyens, qui regroupe les contributions et les dol\'eances des citoyens fran\c{c}ais d\'epos\'ees au niveau des mairies dans le cadre du Grand D\'ebat National. L'article offre un \'etat de l'art complet sur les divers travaux r\'ealis\'es sur ce corpus et vise \`a obtenir une compr\'ehension approfondie des th\`emes \'emergents et des pr\'eoccupations citoyennes dans les diff\'erentes r\'egions. Plusieurs hypoth\`eses concernant ces travaux ont \'et\'e \'emises, et diff\'erentes m\'ethodes ont \'et\'e propos\'ees pour r\'epondre \`a ces hypoth\`eses, de la segmentation et du pr\'e-traitement du corpus au calcul des vecteurs de plongement des phrases \`a l'aide de mod\`eles de langues pr\'e-entra{\^\i}n\'es, aboutissant au clustering de ces vecteurs pour construire des regroupements en fonction des probl\'ematiques abord\'ees.",
    keywords = "TAL,Cahiers Citoyens,Grand d\'ebat National,Corpus,Mod\`ele de langue,Vecteur de plongement,Classification",
    url = "1686.pdf"
}
