ReToP: Apprendre à réécrire les dossiers médicaux de patients pour la prédiction clinique
Jesus Lovón Melgarejo, Jose G Moreno, Christine Damase-Michel, Lynda Tamine
Résumé : Bien que les dossiers médicaux de patients (DMP) fournissent des informations cliniques essentielles, leur complexité rend la modélisation prédictive difficile \cite{lovon2025}. Les grands modèles de langue (GML) atténuent en partie ces limitations en enrichissant les représentations des DMP grâce à des connaissances médicales. Toutefois, les méthodes sous-jacentes sont indépendantes des tâches et n’exploitent pas pleinement les signaux spécifiques aux objectifs prédictifs de ces tâches. Dans cet article, nous présentons \textbf{Re}write-\textbf{To}-\textbf{P}redict (\textbf{ReToP}), une approche fondée sur des LLM qui réalise un entraînement bout-à-bout d’un modèle de réécriture de DMP et d'un modèle de prédiction clinique. \textbf{ReToP} réalise un alignement de la réécriture avec la prédiction via un score \textit{Classifier Supervised Contribution (CSC)} permettant la génération de réécritures cliniquement pertinentes qui renforce directement la performance prédictive. Sur trois tâches cliniques issues de MIMIC-IV, \textbf{ReToP} dépasse les modèles de référence et démontre une forte généralisabilité à de nouveaux ensembles de données et tâches avec un ajustement minimal. \emph{Ce travail est paru dans les actes de la conférence Web Search and Data Mining Conference WSDM '26 et sera présenté à l'atelier LLM@Hopital'26. Pour une description détaillée se référer à l'article}
Mots clés : Grand Modèle de Langue, Dossier Médical de Patient, Prédiction Clinique