@inproceedings{Qorrasi-Pernelle-Grezka:CORIA-TALN-2026:2026,
    author = "Qorrasi, Ueda and Pernelle, Nathalie and Grezka, Aude",
    title = "De la Monarchie \`a la D\'emocratie : Une Analyse des Annotations de Sentiment des LLMs dans le Discours Politique Albanais",
    booktitle = "Actes de CORIA-TALN 2026. Actes des 33\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles.  Volume 1 : articles scientifiques originaux",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "165-180",
    note = "",
    abstract = "Cet article propose une analyse diachronique de l{\textquoteright}annotation des sentiments dans le discours parle-
mentaire albanais, en comparant un gold standard humain aux pr\'edictions de mod\`eles de langage
de grande taille (LLMs). Deux corpus de 1 000 phrases chacun ont \'et\'e constitu\'es pour les p\'eriodes
1937{\textendash}1938 et 2024{\textendash}2025. Le corpus ancien refl\`ete une vari\'et\'e dialectale non standardis\'ee, tandis
que le corpus contemporain est r\'edig\'e en albanais standard. Trois annotateurs humains ont \'evalu\'e
chaque phrase selon la polarit\'e (positif, n\'egatif, neutre), permettant d{\textquoteright}\'etablir une r\'ef\'erence. Les
m\^emes donn\'ees ont ensuite \'et\'e annot\'ees par ChatGPT et Gemini en configuration zero-shot, sans
entra{\^\i}nement pr\'ealable. L{\textquoteright}\'evaluation montre une accuracy qui est marginalement plus \'elev\'ee pour
les textes contemporains, pour les deux LLMs (accuracy variant de 75,40\\% \`a 79,50\\%). Cependant,
l{\textquoteright}\'etude montre que les caract\'eristiques des phrases mal annot\'ees varient fortement selon les p\'eriodes.",
    keywords = "analyse de sentiment, langue peu dot\'ee, LLM, discours parlementaire, discours politique",
    url = "58.pdf"
}