@inproceedings{Gaudray-Bouju-Menel-Eshkol-Taravella-Barbedette:CORIA-TALN:2025,
    author = "Gaudray Bouju, Vanessa and Menel, Mahamdi and Eshkol-Taravella, Iris and Barbedette, Ang\`ele",
    title = "Peut-on retrouver votre \^age \`a partir de la transcription de votre parole ?",
    booktitle = "Actes de CORIA-TALN-RJCRI-RECITAL 2025. Actes des 32\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles (TALN),  volume 1 : articles scientifiques originaux",
    month = "6",
    year = "2025",
    address = "Marseille, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "599-613",
    note = "",
    abstract = "L'identification et la classification des groupes sociaux \`a partir du langage constitue une pr\'eoccupation sociolinguistique majeure. Dans cet article, nous pr\'esentons une recherche de classification des locuteurs bas\'ee sur leur \^age. Pour ce faire, nous exploitons un corpus de donn\'ees du fran\c{c}ais oral, o\`u chaque locuteur est associ\'e \`a des m\'etadonn\'ees, dont son \^age au moment de l'enregistrement. Notre objectif est de d\'evelopper des m\'ethodes d'apprentissage automatique capables de pr\'edire la tranche d'\^age d'un locuteur \`a partir de son discours transcrit de l'oral, allant de l'apprentissage supervis\'e \`a l'ing\'enierie de prompts sur des grands mod\`eles de langage. Cette t\^ache n'est pas seulement un d\'efi technique, elle soul\`eve \'egalement des questions fondamentales sur la nature de la variation linguistique et sur les liens entre le langage et la soci\'et\'e. En effet, en identifiant les corr\'elations entre certains traits linguistiques et l'\^age, notre projet contribue \`a enrichir notre compr\'ehension des m\'ecanismes sous-jacents \`a la variation du langage et \`a ses implications dans la construction de l'identit\'e sociale. Son autre apport est de questionner les traits linguistiques classiquement imput\'es \`a une tranche d'\^age afin de montrer leurs limites.",
    keywords = "\^age, sociolinguistique, classification, traits linguistiques, LLM",
    url = "https://talnarchives.atala.org/TALN/TALN-2025/143.pdf"
}
