Actes des 33ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : articles scientifiques originaux

Quentin Lemesle, Leane Jourdan, Daisy Munson, Pierre Alain, Jonathan Chevelu, Arnaud Delhay, Damien Lolive » [article] [bib] [résumé]
*-PLUIE : une mesure personnalisable utilisant un LLM pour une meilleure évaluation
Eunice Akani, Tristan Vigliano, Helena Unzue Gros, Youssef Trardi » [article] [bib] [résumé]
ATALAT : Un corpus parallèle latin–français pour la traduction automatique
Keming Yi, Valentina Fedchenko » [article] [bib] [résumé]
Adaptation de modèles de reconnaissance automatique de la parole pour le yiddish, langue sans standard oral
Alicia Breidenstein, Marguerite Leang, Matthieu Labeau » [article] [bib] [résumé]
Affinés pour la réussite : Évaluation des représentations dans le domaine de la formation professionnelle
Jérémie Roux, Hani Guenoune, Mathieu Lafourcade, Joël Maïzi, Philippe Langlais » [article] [bib] [résumé]
AnalogiX : un corpus d’analogies annotées en structure et qualité
Leo Rongieras, Luce Lefeuvre » [article] [bib] [résumé]
Annotation collaborative de faits et d'opinions dans des données conversationnelles
Rayan Ziane, Maximin Coavoux, Benjamin Lecouteux, Emmanuel Schang » [article] [bib] [résumé]
Apprentissage actif pour l'annotation morphosyntaxique du créole haïtien
Maryem Bouziane, Salima Mdhaffar, Yannick Estève » [article] [bib] [résumé]
Apprentissage de plusieurs représentations d’attributs au niveau de l’énoncé avec un encodeur de parole unifié
Salim Abdou Daoura, Sondes Bannour Souihi, Romaric Besançon, Olivier Ferret » [article] [bib] [résumé]
Approche guidée par la confiance pour l'annotation automatique d'un corpus de pré-entraînement en extraction d'événements
Ueda Qorrasi, Nathalie Pernelle, Aude Grezka » [article] [bib] [résumé]
De la Monarchie à la Démocratie : Une Analyse des Annotations de Sentiment des LLMs dans le Discours Politique Albanais
Hee-Soo Choi, Mathieu Constant, Karën Fort, Bruno Guillaume » [article] [bib] [résumé]
Désambiguïsation lexicale d'exemples lexicographiques du français : intégration de plongements de graphe et évaluation
Ahana Chattopadhyay, Hanady Yasmine » [article] [bib] [résumé]
Étude des formalismes émergents de représentation sémantique
Robin Armingaud, Romaric Besançon » [article] [bib] [résumé]
Évaluation d’un modèle bi-encodeur généraliste pour l’extraction de relations documentaires en contexte de données limitées
Rebecca Knowles, Fatemeh Azadi, Michel Simard, Chi-kiu Lo, Samuel Larkin, Marc Tessier, Cyril Goutte » [article] [bib] [résumé]
Évaluer et atténuer les différences de performance des GLM pour les tâches de génération de textes français et anglais
Amine Kobeissi, Philippe Langlais » [article] [bib] [résumé]
Évaluer la récupération dans les systèmes RAG pour la question-réponse financière sur longs documents
Markarit Vartampetian, Diandra Fabre, Philippe Mulhem, Fouad Hassani, Didier Schwab » [article] [bib] [résumé]
Génération de Questions-réponses expertes : YourExpertBench+
Clémentine Bleuze, Karën Fort, Vincent P. Martin, Aurélie Névéol » [article] [bib] [résumé]
Grands modèles de langue pour prédire la santé mentale : une revue exploratoire de la documentation des biais et de l’utilité clinique
Lounès Kebdi, Lubin Longuépée, Mathilde Aguiar, Pierre Zweigenbaum, Nona Naderi » [article] [bib] [résumé]
Impact de l'affinage de modèles génératifs pour l'inférence en langue naturelle appliquée aux essais cliniques : comparaison avec des approches de *few-shot learning*
Noureddine Khaous, Guillaume Wisniewski » [article] [bib] [résumé]
L’accent comme structure géométrique persistante dans les représentations de la parole
Fanny Ducel, Sayaka Sato, Lucie Escasain, Aurélie Névéol, Karën Fort, Pascal Gygax » [article] [bib] [résumé]
L'écriture inclusive dans les invites des modèles de langue : une stratégie gagnant-gagnant
Rémi Cardon, Gaël Guibon » [article] [bib] [résumé]
Le corpus LN-ATALA : 25 ans d'annonces du traitement automatique des langues modérées et catégorisées
Fanny Ducel, Lucie Digoin-Caparros, Ibrahim Al Kotob, Shayan Ahmed Shariff, Binesh Arakkal Remesh, Aurélie Névéol, Karën Fort » [article] [bib] [résumé]
Les benchmarks sont une source de biais des LLM : MMLU, CommonSenseQA et MGSM au microscope
Raphael Rubino, Sandra Coram-Mekkey, Pierrette Bouillon » [article] [bib] [résumé]
Normalisation du moyen français : comparaison de modèles pré-entraînés
Clémentine Bleuze, Bruno Guillaume, Aurélie Névéol, Karën Fort » [article] [bib] [résumé]
Omniprésents et anthropomorphisés : analyse lexico-syntaxique des discours sur les LLM
Estelle Zheng, Sébastien Warichet, Emmanuel Helbert, Christophe Cerisara » [article] [bib] [résumé]
Oui à l'Échelle, Non à la Mémoire: Affinage Léger des LLMs par Réseaux Latéraux
Shuyang Sun, Antoine Venant » [article] [bib] [résumé]
Q-COMP : un jeu de données pour l’évaluation du traitement compositionnel de la quantification dans les grands modèles de langue
Kirill Milintsevich, Agnès Saulnier » [article] [bib] [résumé]
Quand le score F1 cache des métriques différentes : le cas de la détection de citations
Ensieh Hemmatan, Benoit Crabbé, Timothée Bernard » [article] [bib] [résumé]
Raffinement itératif pour l’analyse des dépendances temporelles à l’échelle du document
Ismail El Jamiy, Guillaume Loizelet, Farah Benamara, Nabil Hathout » [article] [bib] [résumé]
Reconnaissance automatique de manuscrits arabes scientifiques médiévaux : Création d'un jeu de données et évaluation de grands modèles de langues
Aurélien Bossard, Christophe Rodrigues » [article] [bib] [résumé]
Résumé automatique de commentaires de football en direct avec grands modèles de langage
Aygalic Jara-Mikolajczak, Thomas Lavergne, Christophe Servan, Sophie Rosset » [article] [bib] [résumé]
Robustesse des LLM dans les contextes longs, hallucinations et détection sur questions-réponses séquentielles
Mohamed Imed Eddine Ghebriout, Gaël Guibon, Thomas Laurenceau, Richard Chocron, Christophe Cerisara, Emmanuel Vincent, Ivan Lerner » [article] [bib] [résumé]
SÛRE : Supervision du Triage aux Urgences par Raisonnement Étapé
Zhongjie LI, Rim Abrougui, Guillaume Lechien, Elisabeth Savatier, Benoît Laurent, Patrick Paroubek » [article] [bib] [résumé]
Sem-G-RAG, combiner sémantique symbolique à base de graphes et LLM pour le RAG
Geoffrey Anquetil, Jonathan Chevelu » [article] [bib] [résumé]
Stéganographie textuelle par paraphrase : une approche par LLM
Paul Lerner, François Yvon » [article] [bib] [résumé]
Sur l’équité politique des grands modèles de langue multilingues
Eve Sauvage, Cyril Grouin, Julien Tourille » [article] [bib] [résumé]
Tous les tokens sont-ils utiles pour les modèles de langues ?
Thomas Checchin, Julien Jacques, Adrien Guille » [article] [bib] [résumé]
Un décodeur pour l'analyse sémantique AMR en français
Morgane Casanova, Amelie Knecht, Thomas Girault, Victor Klötzer, Tanguy Launay, Pascale Sebillot, laurent amsaleg, Guillaume Gravier » [article] [bib] [résumé]
Un retour d'expériences sur l'adaptation de modèles de langue à la presse régionale : connaissance n'est pas compétence !
Quentin Lemesle, Jonathan Chevelu, Arnaud Delhay, Damien Lolive » [article] [bib] [résumé]
Une étude empirique de la capacité de génération de paraphrases des (S/M)LMs
Agathe Wallet, Brice Brossette, Lucile Gelin, Stéphane Huet, Nathalie Camelin » [article] [bib] [résumé]
Vers l’évaluation automatique de résumés oraux d’enfants : Étude exploratoire de métriques de compréhension
Abdelkrim Beloued » [article] [bib] [résumé]
Vers un benchmark pour une évaluation robuste de la catégorisation de contenus audiovisuels transcrits
Shu Okabe, Alexander Fraser » [article] [bib] [résumé]
Vers une fouille de phrases parallèles pour les langues régionales de France métropolitaine
Allan Henry, Solange Rossato, Christian Graff, Sylvain Huet, Jose-Ernesto Gomez-Balderas » [article] [bib] [résumé]
VoiceStick : un corpus de parole spontanée pour le guidage vocal de drones

Actes des 33ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 : articles déjà publiés

Fanny Ducel, Aurélie Névéol, Vidit Khazanchi, Loïc Leclere, Arthur Pedrini, Léa Bouchet, Benjamin Caissial, Karën Fort » [article] [bib] [résumé]
"Le code-switching comme indicateur de biais dans les LLM : ""The consequences are not the same para nosotros"""
Yi Yu, Maria Boritchev, Chloé Clavel » [article] [bib] [résumé]
Analyse Automatique de la Collaboration à partir de Ressources de Données Conversationnelles Humaines : Une Revue
Doria Bonzi, Alexandre Guiggi, Frederic Bechet, Carlos Ramisch, Benoit Favre » [article] [bib] [résumé]
CareMedEval : Evaluer l'Analyse Critique et le Raisonnement dans le Domaine Biomédical
Julien Bezançon, Gaël Lejeune, Marceau Hernandez » [article] [bib] [résumé]
Comment j'ai recontré ton snowclone : Découverte non-supervisée de moules de snowclones dans de grands jeux de données
Adam Remaki, Christel Gérardin, Eulàlia Farré-Maduell, Martin Krallinger, Xavier Tannier » [article] [bib] [résumé]
Compléter des annotations humaines par des données synthétiques pour l’alignement d’entités biomédicales
Rodrigo Wilkens, Rémi Cardon, Vincent Folny, Thomas François » [article] [bib] [résumé]
Correction automatique de textes d'apprenants et certification linguistique en français~: évaluation de la généralisabilité, de l'accord et de la validité
Anas Belfathi, Nicolas Hernandez, Monceaux Laura, Warren Bonnard, Mary Catherine Lavissière, Christine Jacquin, Richard Dufour » [article] [bib] [résumé]
Couplage du contexte local et de prototypes sémantiques globaux via une architecture hiérarchique pour l’étiquetage des rôles rhétoriques
Pierre Lepagnol, Sahar Ghannay, Thomas Gerald, Christophe Servan, Sophie Rosset » [article] [bib] [résumé]
De l’importance des formats : une évaluation critique des formats de sorties dans les amorces des Grands Modèles de Langues pour la compréhension de la parole et la REN
Latifa Iben Nasr, Ismail Badache, Abir Masmoudi, Lamia Belguith » [article] [bib] [résumé]
DiaTAC-Emo : Dialecte Tunisien - Analyse à deux niveaux pour la Classification des Émotions
Brahim Touayouch, Loïc Fosse, Géraldine Damnati, Gwénolé Lecorvé » [article] [bib] [résumé]
DivMerge: une méthode de fusion de modèles pour le multi-tâches fondée sur une divergence
Charlotte Noel, Nicholas Asher, Olivier Gouvert, Farah Benamara, Julie Hunter » [article] [bib] [résumé]
EIFFEL: Un corpus d’expressions idiomatiques françaises pour évaluer les biais anglocentriques des GLMs
Maxime Fily, Guillaume Wisniewski, Martine Adda-Decker » [article] [bib] [résumé]
Étude de la variabilité de la prononciation dans des plongements de grands modèles audio. Effets du locuteur et de la L1 en français L2
Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel Morin » [article] [bib] [résumé]
Étude des stéreotypes de genre dans les LLM à l'aide des Déterminants Sociaux de la Santé
Ziyan Xu, Marina Seghier, Alice Millour, Carlos-Emiliano González-Gallardo, Jean-Yves Antoine » [article] [bib] [résumé]
Évaluation de l'adaptabilité des grands modèles de langage aux genres linguistiques attestés (AGLAGLA)
Valentina Fedchenko, Eric Jordan » [article] [bib] [résumé]
Exploiter les similitudes linguistiques pour la transcription vocale à faibles ressources
Pierre-Antoine Lequeu, Léo Labat, Laurène Cave, Gaël Lejeune, François Yvon, Benjamin Piwowarski » [article] [bib] [résumé]
GDN-CC : un jeu de données pour la clarification automatique de corpus de consultations citoyennes assistées par l’IA
Matthieu Dubois, François Yvon, Pablo Piantanida » [article] [bib] [résumé]
L'impact de l'échantillonnage sur la détectabilité des textes rédigés par une IA
Aidan Mannion, Cécile Macaire, Armand Violle, Stéphane Ohayon, Xavier Tannier, Didier Schwab, Lorraine Goeuriot, François Portet » [article] [bib] [résumé]
La spécialisation de domaine est-elle toujours pertinente ? Une étude de l'adaptation de modèles de langue génératifs sur un nouveau corpus biomédical français
Antoine Taroni, Ludovic Moncla, Frederique Laforest » [article] [bib] [résumé]
La traduction du point de vue de l’Information Bottleneck : une analyse d’efficience des prépositions spatiales dans des bitextes
Aina Garí Soler, Jenny Myrendal, Chloé Clavel, Staffan Larsson » [article] [bib] [résumé]
Le corpus NeWMe : un corpus de référence pour l’étude de la négociation du sens des mots
Evangelia Zve, Benjamin Icard, Alice Breton, Lila Sainero, Gauvain Bourgne, Jean-Gabriel Ganascia » [article] [bib] [résumé]
Le rôle des valeurs aberrantes dans l’anticipation de nouvelles thématiques : approche par représentations vectorielles sur un corpus d’actualité
Vishnou Vinayagame, Gregory Senay, Luis Martí » [article] [bib] [résumé]
MATATA: raisonnement Mathématique Augmenté au Travers d'outils pour des Applications TAbulaires sous supervision faible de bout en bout
Benjamin Vendeville, Liana Ermakova, Pierre De Loor, Jaap Kamps » [article] [bib] [résumé]
MIRAGE : une bibliothèque de métriques pour évaluer les hallucinations dans les textes générés
Salima Mdhaffar, Haroun Elleuch, Chaimae Chellaf, Maryem Bouziane, Ha Nguyen, Yannick Estève » [article] [bib] [résumé]
Modèle SENSE : une solution open source pour les tâches multilingues et multimodales basées sur la sémantique
Zineddine Tighidet, Andrea Mogini, Hedi Ben younes, Jiali Mei, Patrick Gallinari, Benjamin Piwowarski » [article] [bib] [résumé]
Modulation de la Copie du Contexte : le Rôle des Neurones d’Entropie dans la Gestion des Conflits entre Connaissances Paramétriques et Contextuelles
Laura De Grazia, Pol Pastells, Mauro Vázquez Chas, Desmond Elliott, Danae Sanchez Villegas, Mireia Farrús, Mariona Taulé Delor » [article] [bib] [résumé]
MuSeD : un dataset multimodal en espagnol pour la détection du sexisme dans les vidéos sur les réseaux sociaux
Phuong-Hang Le, Valentin Pelloin, Arnault Chatelain, Maryem Bouziane, Mohammed Ghennai, Qianwen Guan, Kirill Milintsevich, Salima Mdhaffar, Aidan Mannion, Nils DEFAUW, Shuyue Gu, Alexandre Audibert, Marco Dinarelli, Yannick Estève, Lorraine Goeuriot, Steffen Lalande, Nicolas Hervé, Maximin Coavoux, François Portet, Etienne Ollion, Marie Candito, Maxime Peyrard, Solange Rossato, Benjamin Lecouteux, Aurélie Nardy, Gilles Sérasset, Vincent Segonne, Solène Evain, Diandra Fabre, Didier Schwab » [article] [bib] [résumé]
Pantagruel : des encodeurs auto-supervisés unifiés pour le texte et la parole
Anna Colli, Delphine Battistelli » [article] [bib] [résumé]
Polysémie et ambiguité : le cas du verbe Devoir
Xavier Pillet, Cédric Gernigon, Anastasia Volkova, Richard Dufour, Adeline Granet » [article] [bib] [résumé]
Réentraînement conscient de la quantification : un arbitrage entre pré-entraînement et affinage des modèles de langue spécialisés
Marie Cousin » [article] [bib] [résumé]
Représentation des structures de dépendance : encodage de la syntaxe profonde de la théorie Sens-Texte avec les grammaires catégorielles abstraites
Benjamin Vendeville, Liana Ermakova, Pierre De Loor » [article] [bib] [résumé]
Ressource pour l'analyse des erreurs en simplification de textes : nouvelle taxonomie et collection de test
Manon Berriche, Célia Nouri, Chloé Clavel, Jean-Philippe Cointet » [article] [bib] [résumé]
SPOT : un jeu de données français annoté pour la détection d’interventions critiques dans les conversations en ligne
Amandine Decker, Maxime Amblard, Ellen Breitholtz » [article] [bib] [résumé]
Sortir du Jour sans Fin : Repenser la Recherche sur le Dialogue à travers une méta-analyse de l'Anthologie ACL 2024
Tatiana Bladier, Henri-José Deulofeu, Alexis Nasr » [article] [bib] [résumé]
SyntaxGym pour le français: Ressource, annotation et évaluation de modèles de langues français et multilingues
Thomas Sebbag, Solen Quiniou, Emmanuel Morin » [article] [bib] [résumé]
Un LLM pour guide : une approche d'extraction non supervisée de relations économiques dans les documents administratifs français.
Ayoub Hammal, Pierre Zweigenbaum, Caio Corro » [article] [bib] [résumé]
Un formalisme fondé sur des approximations du problème du sac à dos pour modéliser l'alignement
Emmett Strickland, Valentina Fedchenko, Marc Evrard » [article] [bib] [résumé]
Une étude pilote sur l'affinage des modèles TTS créoles : le vocabulaire lexificateur ou la phonologie du substrat, lequel est le plus déterminant ?
Judith Jeyafreeda Andrew, Juliette Potier, Nicolas Garcelon, Anita Burgun, Marc Vincent » [article] [bib] [résumé]
Utilisation de modèles de langue de grande taille pour l’extraction de relations temporelles dans les comptes rendus cliniques pédiatriques
Chaimae Chellaf, Salima Mdhaffar, Yannick Estève, Stéphane Huet » [article] [bib] [résumé]
Utilisation de représentations vectorielles de phrases, multimodales et indépendantes de la langue, pour le résumé abstractif
Siman Chen, Ilaine Wang, Maxime Fily, Pierre Magistry » [article] [bib] [résumé]
Utilisation des modèles de parole pour la recherche lexicale par audio dans les dictionnaires : application au Teochew
Ivanhoé Botcazou, Tassadit Amghar, Sylvain Lamprier, Frédéric Saubion » [article] [bib] [résumé]
Vers un contrôle plus robuste de la longueur de génération pour les modèles de langue auto-régressifs
Julien Aubert-Béduchaud, Florian Boudin, Akiko Aizawa, Beatrice Daille, Richard Dufour » [article] [bib] [résumé]
Vers une annotation fiable des contributions scientifiques dans les articles soumis à l’ACL Rolling Review

Actes de la session industrielle de CORIA-TALN 2026

Thomas Soulas, Yves Ferstler, Valentyna Tsilinchuk, Yassine Chahdi, Catherine Lavoie, Gaëlle Laperrière, Marie-Jean Meurs » [article] [bib] [résumé]
Calame : Un logiciel de transcription en code source libre
Cédric Lopez, Lucas Aubertin, Jean Bort, Stéphane Froliger » [article] [bib] [résumé]
De la conception du formalisme de représentation sémantique MR4AP aux solutions métiers
Victor Klötzer, Thomas Girault, Michel Le Nouy, Julien Perron, Cédric Jézéquel, Laurent Amsaleg » [article] [bib] [résumé]
Un journalisme augmenté par une IA souveraine — Lexpérience Ouest-France
Rita Nohra, Natalia Kalashnikova, Mohamad Al Assaad » [article] [bib] [résumé]
Architecture multi-agents au service de la RQTH
Jean-Baptiste Juin, Thomas Leguere » [article] [bib] [résumé]
Évaluation des performances des systèmes à base de LLM : métriques globales et locales au service de l’adoption
Hichem Semmar, Eric SanJuan » [article] [bib] [résumé]
Réévaluation de FACTUM : étude de réplication et analyse inter-modèles sur des modèles de langage open-weight

talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Actes des 33ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : articles scientifiques originaux

Actes des 33ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 : articles déjà publiés

Actes de la session industrielle de CORIA-TALN 2026