Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux

Clémentine Bleuze, Fanny Ducel, Maxime Amblard, Karën Fort » [article] [bib] [résumé]
« De nos jours, ce sont les résultats qui comptent » : création et étude diachronique d'un corpus de revendications issues d'articles de TAL
Alexander Petrov, Antoine Venant, François Lareau, Yves Lepage, Philippe Langlais » [article] [bib] [résumé]
ALF : Un jeu de données d'analogies françaises à grain fin pour l'évaluation de la connaissance lexicale des grands modèles de langue
Ikram Belmadani, Benoit Favre, Richard Dufour, Frédéric Bechet, Carlos Ramisch » [article] [bib] [résumé]
Adaptation des connaissances médicales pour les grands modèles de langue : Stratégies et analyse comparative
Olivier Kraif » [article] [bib] [résumé]
Alignement bi-textuel adaptatif basé sur des plongements multilingues
Joanna Radoła, François Yvon » [article] [bib] [résumé]
Alignements divisifs de textes parallèles: données, algorithme et évaluation
Frédéric Charpentier, Jairo Cugliari Duhalde, Adrien Guille » [article] [bib] [résumé]
Alignements entre attention et sémantique dans des modèles de langues pré-entraînés
Maxime Bouthors, Josep Crego, François Yvon » [article] [bib] [résumé]
Améliorer la Traduction Neuronale par Exemple avec des Données Monolingues
Martina Barletta, Claude Ponton » [article] [bib] [résumé]
Analyse de la continuité référentielle dans le corpus d'écrits scolaires français et italien Scolinter
Chunxiao Yan, Iris Eshkol-Taravella, Sarah De Vogué, Marianne Desmets » [article] [bib] [résumé]
Augmentation des données par LLM pour améliorer la détection automatique des erreurs de coordination
Hichem Ammar Khodja, Frederic Bechet, Quentin Brabant, Alexis Nasr, Gwénolé Lecorvé » [article] [bib] [résumé]
Connaissances factuelles dans les modèles de langue : robustesse et anomalies face à des variations simples du contexte temporel
Raoul Blin, Jinnam Choi » [article] [bib] [résumé]
Corpus multilingue annoté pour l'étude sémantique des expressions quantifiantes – Problèmes de segmentation du coréen et du japonais
Yves Ferstler, Catherine Lavoie, Marie-Jean Meurs » [article] [bib] [résumé]
Détecter des comportements associés aux troubles alimentaires par l'analyse automatique des publications textuelles en ligne
Coralie Pottiez, Thierry Hamon, Natalia Grabar » [article] [bib] [résumé]
Détection de métaphores dans les documents médicaux
Pierre Lepagnol, Thomas Gerald, Sahar Ghannay, Christophe Servan, Sophie Rosset » [article] [bib] [résumé]
Détection des contaminations de LLM par extraction de données : une revue de littérature pratique
Achir Oukelmoun, Nasredine Semmar, Gaël de Chalendar, Clement Cormi, Mariame Oukelmoun, Eric Vibert, Marc-Antoine Allard » [article] [bib] [résumé]
Détection des omissions dans les résumés médicaux générés par les grands modèles de langue
Guillaume De Murcia, Ludovic Meineri, Laurent Gillard, Thomas Gouritin, Samy Lastmann » [article] [bib] [résumé]
Détection et évaluation de la communication toxique pour la relation client par des LLMs
Vivien Leonard, Beatrice Markhoff, Jean-Yves Antoine » [article] [bib] [résumé]
ELITEC : un corpus de conversations en microposts français annoté pour le liage d'entités Wikidata
Ludovic Tanguy, Cécile Fabre, Nabil Hathout, Lydia-Mai Ho-Dac » [article] [bib] [résumé]
Embeddings, topic models, LLM : un air de famille
Loïc Fosse, Benoît Favre, Frédéric Béchet, Géraldine Damnati, Gwénolé Lecorvé » [article] [bib] [résumé]
Estimation de l'inclusion entre tâches par projection spectrale de vecteurs de tâches
Ricardo Rodriguez, Stéphane Huet, Benoit Favre, Mickael Rouvier » [article] [bib] [résumé]
Étude comparative de réponses humaines et de grands modèles de langue à des QCM en pharmacie
Fanny Bachey, Christophe Rodrigues, Aurélien Bossard » [article] [bib] [résumé]
Étude critique du corpus CNN/DailyMail pour le résumé automatique
Nina Nusbaumer, Guillaume Wisniewski, Benoît Crabbé » [article] [bib] [résumé]
Évaluer la capacité des transformeurs à distinguer les significations compositionnelles et idiomatiques d'une même expression
Anna Colli, Delphine Battistelli » [article] [bib] [résumé]
Exploration de la modalité en français parlé et écrit
William N. Havard, Shrita Hassamal, Muhsina Alleesaib, Guilhem Florigny, Guillaume Fon Sing, Anne Abeillé, Benjamin Lecouteux, Emmanuel Schang » [article] [bib] [résumé]
Exploration de la séparation en langues dans les modèles de traitement de la parole auto-supervisés multilingues préentraînés avec des données écologiques
Léane Jourdan, Florian Boudin, Nicolas Hernandez, Richard Dufour » [article] [bib] [résumé]
Identification de mesures d'évaluation fiables pour la révision de textes scientifiques
Antoine Boiteau, Yann Mathet, Antoine Widlöcher » [article] [bib] [résumé]
Intégration des relations inter-référents dans l'annotation de la coréférence : modèle et application
Oksana Ivchenko, Natalia Grabar » [article] [bib] [résumé]
L'Impact de la complexité textuelle sur le comportement de lecture : une analyse oculométrique et de la surprise des textes français
Laura Zanella, Ambroise Baril » [article] [bib] [résumé]
La confiance de Mistral-7B est-elle justifiée ? Une évaluation en auto-estimation pour les questions biomédicales
Vincent P. Martin, Karën Fort, Jean-Arthur Micoulaud-Franchi » [article] [bib] [résumé]
Latrumplang, instrument de destruction de la pensée : analyse de l'impact de la censure trumpiste sur la recherche en santé mentale
Anas Belfathi, Nicolas Hernandez, Laura Monceaux, Richard Dufour » [article] [bib] [résumé]
Le rôle du contexte dans la classification séquentielle de phrases pour les documents longs
Matthieu Dubois, Yvon François, Pablo Piantanida » [article] [bib] [résumé]
MOSAIC : Mélange d'experts pour la détection de textes artificiels
Marie Flesch, Heather Burnett » [article] [bib] [résumé]
Mesurer les inégalités de genre en ligne avec le genre grammatical : Une étude du subreddit r/france
William N. Havard, Renauld Govain, Benjamin Lecouteux, Emmanuel Schang » [article] [bib] [résumé]
Modèles auto-supervisés de traitement de la parole pour le Créole Haitien
Wafa Aissa, Thibault Bañeras-Roux, Elodie Vanzeveren, Lingyun Gao, Alice Pintard, Rodrigo Wilkens, Thomas François » [article] [bib] [résumé]
Modélisation de la lisibilité en français pour les personnes en situation d'illettrisme
Huy Hoang Ha » [article] [bib] [résumé]
Pensez: Moins de données, meilleur raisonnement – Repenser les LLM français
Vanessa Gaudray Bouju, Mahamdi Menel, Iris Eshkol-Taravella, Angèle Barbedette » [article] [bib] [résumé]
Peut-on retrouver votre âge à partir de la transcription de votre parole ?
Eve Sauvage, Iskandar Boucharenc, Thomas Gerald, Julien Tourille, Sabrina Campano, Cyril Grouin, Sophie Rosset » [article] [bib] [résumé]
Plongement des constituants pour la représentation sémantique des phrases
Olivier Ferret » [article] [bib] [résumé]
Projeter pour mieux fusionner : une histoire de bandit et de lit
Mohamed Imed Eddine Ghebriout, Gaël Guibon, Ivan Lerner, Emmanuel Vincent » [article] [bib] [résumé]
QUARTZ : Approche abstractive non supervisée par question-réponse pour le résumé de dialogue orienté tâche
Anna Mosolova, Marie Candito, Carlos Ramisch » [article] [bib] [résumé]
Raffinage des représentations des tokens dans les modèles de langue pré-entraînés avec l’apprentissage contrastif : une étude entre modèles et entre langues
Samuel Mallet, Joe El Khoury, Elöd Egyed-Zsigmond » [article] [bib] [résumé]
Repousser les limites des benchmarks actuels pour une évaluation réaliste des LLMs en migration de code
Maachou Khalil, Chloé Braud, Philippe Muller » [article] [bib] [résumé]
Supervision faible pour la classification des relations discursives
Marie Cousin » [article] [bib] [résumé]
Syntaxe en dépendance avec les grammaires catégorielles abstraites : une application à la théorie sens-texte
Emmett Strickland, Ilaine Wang, Damien Nouvel, Bénédicte Diot-Parvaz Ahmad » [article] [bib] [résumé]
Systèmes d'écriture et qualité des données : l'affinage de modèles de translittération dans un contexte de faibles ressources
Abdelkrim Beloued » [article] [bib] [résumé]
Traitement automatique des évènements médiatiques : Détection, classification, segmentation et recherche sémantique
Eleni Metheniti, Swarnadeep Bhar, Nicholas Asher » [article] [bib] [résumé]
Une revue sur les hallucinations des LLM
Laura Alonzo Canul, Benjamin Lecouteux, François Portet » [article] [bib] [résumé]
Vers l'entraînement de modèles de reconnaissance automatique de la parole auto-supervisés équitables sans étiquettes démographiques
Jeongwoo Kang, Maria Boritchev, Maximin Coavoux » [article] [bib] [résumé]
ding-01 :ARG0 Un corpus AMR pour le français parlé spontané
Juan-José Guzman-Landa, Juan-Manuel Torres-Moreno, Martha-Lorena Avendaño-Garrido, Miguel Figueroa-Saavedra, Ligia Quintana-Torres, Graham Ranger, Carlos-Emiliano González-Gallardo, Elvys Linhares Pontes, Patricia Velazquez-Morales, Luis Gil Moreno Jiménez » [article] [bib] [résumé]
π-YALLI : un nouveau corpus pour des modèles de langue nahuatl / Yankuik nawatlahtolkorpus pampa tlahtolmachiotl

Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publiés

Fanny Ducel, Nicolas Hiebel, Olivier Ferret, Karën Fort, Aurélie Névéol » [article] [bib] [résumé]
« Les femmes ne font pas de crise cardiaque ! » Étude des biais de genre dans les cas cliniques synthétiques en français
Julien Aubert-Béduchaud, Florian Boudin, Béatrice Daille, Richard Dufour » [article] [bib] [résumé]
ACL-rlg : Un dataset pour la génération de listes de lecture
Thomas Sebbag, Solen Quiniou, Niclas Stucky, Emmanuel Morin » [article] [bib] [résumé]
AdminSet and AdminBERT : un jeu de données et un modèle de langue pré-entraîné pour explorer le dédale non structuré des données administratives françaises
Nazanin Shafiabadi, Guillaume Wisniewski » [article] [bib] [résumé]
Anti-surprise : Une métrique complémentaire pour évaluer l'apprentissage lexical des (grands) modèles de langue
Mohamed Salim Aissi, Clement Romac, Thomas Carta, Sylvain Lamprier, Pierre-Yves Oudeyer, Olivier Sigaud, Laure Soulier, Nicolas Thome » [article] [bib] [résumé]
Apprentissage par renforcement pour l'alignement des agents LLMs avec des environnements interactifs : quantification et réduction du surapprentissage aux prompts
Erwan Fagnou, Paul Caillon, Blaise Delattre, Alexandre Allauzen » [article] [bib] [résumé]
Attention Chaînée et Causale pour un Suivi Efficace des Entités
Théo Gigant, Camille Guinaudeau, Marc Decombas, Frédéric Dufaux » [article] [bib] [résumé]
Atténuer l'impact de la qualité des références sur l'évaluation des systèmes de résumé grâce aux métriques sans référence
Simon Mille, Massimiliano Pronesti, Craig Thomson, Michela Lorandi, Sophie Fitzpatrick, Rudali Huidrom, Mohammed Sabry, Amy O'Riordan, Anya Belz » [article] [bib] [résumé]
Combler les lacunes de Wikipédia : tirer parti de la génération de texte pour améliorer la couverture encyclopédique des groupes sous-représentés
Chenwei Wan, Matthieu Labeau, Chloé Clavel » [article] [bib] [résumé]
EmoDynamiX : Prédiction de stratégies de dialogue pour le support émotionnel via la modélisation de mélange d'émotions et de la dynamique du discours
Foucauld Estignard, Sahar Ghannay, Julien Girard-Satabin, Nicolas Hiebel, Aurélie Névéol » [article] [bib] [résumé]
Évaluation de la confidentialité des textes cliniques synthétiques générés par des modèles de langue
Gaspard Michel, Elena Epure, Romain Hennequin, Christophe Cerisara » [article] [bib] [résumé]
Évaluation des LLMs pour l'Attribution de Citations dans les Textes Littéraires: une Étude de LLaMa3
Motasem Alrahabi, Nacef Ben Mansour, Hamed Rahimi » [article] [bib] [résumé]
Extraction de mots-clés à partir d'articles scientifiques: comparaison entre modèles traditionnels et modèles de langue
Nihed Bendahman, Karen Pinel-Sauvagnat, Gilles Hubert, Mokhtar Boumedyen Billami » [article] [bib] [résumé]
Faut-il éliminer toutes les hallucinations dans un résumé abstractif pour le domaine juridique ?
Enzo Doyen, Amalia Todirascu » [article] [bib] [résumé]
GeNRe : un système de neutralisation automatique du genre exploitant les noms collectifs
Imed Keraghel, Mohamed Nadif » [article] [bib] [résumé]
Graphes, NER et LLMs pour la classification non supervisée de documents
Thibaud Leteno, Irina Proskurina, Antoine Gourru, Julien Velcin, Charlotte Laclau, Guillaume Metzler, Christophe Gravier » [article] [bib] [résumé]
HISTOIRESMORALES: Un jeu de données français pour évaluer l'alignement moral des modèles de langage
Ahmed Njifenjou, Virgile Sucal, Bassam Jabaian, Fabrice Lefèvre » [article] [bib] [résumé]
Incorporation de Traits de Personnalité dans les Agents Conversationnels à base de GML : Étude de Cas de l'Assistance Client en Français
Mathilde Aguiar, Pierre Zweigenbaum, Nona Naderi » [article] [bib] [résumé]
Inférence en langue naturelle appliquée au recrutement de patients pour les essais cliniques : le point de vue du patient
Eve Sauvage, Sabrina Campano, Lydia Ould Ouali, Cyril Grouin » [article] [bib] [résumé]
La structure du contenu textuel a-t-elle un impact sur les modèles linguistiques pour le résumé automatique ?
Rimane Karam, Julien Bezançon, Gaël Lejeune » [article] [bib] [résumé]
Lost In Variation : extraction non-supervisée de motifs lexico-syntaxiques dans des textes en moyen arabe
Sergei Bogdanov, Alexandre Constantin, Timothée Bernard, Benoît Crabbé, Étienne Bernard » [article] [bib] [résumé]
NuNER : Pré-entraînement d'un encodeur pour la reconnaissance d'entités nommées avec des données annotées automatiquement
Jose G Moreno, Jesus Lovon-Melgarejo, M'Rick Robin-Charlet, Christine Damase-Michel, Lynda Tamine » [article] [bib] [résumé]
PatientDx : Fusion des grands modèles de langue pour la protection de la confidentialité des données dans le domaine de la santé
Benjamin Icard, Evangelia Zve, Lila Sainero, Alice Breton, Jean-Gabriel Ganascia » [article] [bib] [résumé]
Représenter le style au-delà des thématiques : une étude d'impact sur la dispersion vectorielle de différents modèles de langage
Florian Le Bronnec, Song Duong, Alexandre Allauzen, Laure Soulier, Vincent Guigue, Alberto Lumbreras, Patrick Gallinari » [article] [bib] [résumé]
SCOPE : un cadre d'entrainement auto-supervisé pour améliorer la fidélité dans la génération conditionnelle de texte
Manon Scholivet, Agata Savary, Louis Estève, Marie Candito, Carlos Ramisch » [article] [bib] [résumé]
SELEXINI – un grand corpus français, divers et parsé automatiquement
Zineddine Tighidet, Andrea Mogini, Jiali Mei, Patrick Gallinari, Benjamin Piwowarski » [article] [bib] [résumé]
Sondage des Modèles de Langue sur leur Source de Connaissance
Bastien Liétard, Pascal Denis, Mikaela Keller » [article] [bib] [résumé]
Vers les Sens et Au-delà : Induire des Concepts Sémantiques Avec des Modèles de Langue Contextuels

Actes de la session industrielle de CORIA-TALN 2025

Shami Thirion Sen, Rime Abrougui, Guillaume Lechien, Damien Nouvel » [article] [bib] [résumé]
Apprentissage Actif à l’ère des Grands Modèles de Langue (LLMs)
Elvys Linhares Pontes, Carlos-Emiliano González-Gallardo, Georgeta Bordea, Jose G Moreno, Mohamed Ben Jannet, Yuxuan Zhao, Antoine Doucet » [article] [bib] [résumé]
Backtesting des signaux de sentiment pour le trading : évaluer la viabilité de la génération d'alpha à partir de l'analyse de sentiment
Benoît Sagot, Slim Ouni, Sam Bigeard, Lucence Ing, Thibault Clérice, Rachel Bawden, Emmanuel Vincent, Malek Yaich, Panagiotis Tsolakis, Juliette Janès, Rasul Dent, Oriane Nédey, Vincent Colotte, Mostafa Sadeghi » [article] [bib] [résumé]
COLaF : Corpus et Outils pour les Langues de France et variétés de français
Edith Galy, Ahmed Moubtahij, Azur Handan, Marc Queudot » [article] [bib] [résumé]
Les modèles multimodaux peuvent-ils aider à l'interprétation de cartes ? Une étude exploratoire avec GPT-4o
Pierre Jourlin, Marc-Antoine Sulmon, David Bensoussan, Émilie Mercadal » [article] [bib] [résumé]
SIMI v3 : Une liste de cas patients similaires pour la télé expertise médicale
Steve Bellart, Arnaud Deleruyelle » [article] [bib] [résumé]
SPARK : Exploiter les échanges techniques passés pour améliorer le support client

talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux

Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publiés

Actes de la session industrielle de CORIA-TALN 2025