Agent Neuro-Symbolique pour l’Identification de Relations Causales
Baptiste Brunet de la Charie, Elöd Egyed-Zsigmond, Ludovic Moncla, Thomas Veran
Résumé : L'extraction de relations causales entre évènements reste un défi en raison de la complexité sémantique, des dépendances à longue distance, de la complexité d'annotation des benchmarks existants et du fort déséquilibre des classes. Les LLMs appliqués à cette tâche souffrent par ailleurs d'asymétries directionnelles et d'hallucinations en l'absence de supervision. Nous présentons un cadre agentique zero-shot augmentant un LLM de deux outils légers : coherence_check, appliquant des règles logiques de cohérence directionnelle propres au jeu de données, et counterfactual_pairs, réévaluant les dépendances causales par génération contrefactuelle au niveau sémantique. Cette conception neuro-symbolique garantit une portabilité multilingue sans adaptation linguistique. Évalué sur les cinq langues de MECI, notre système obtient des résultats compétitifs avec les méthodes supervisées sans aucune donnée d'entraînement. Nous mettons également en évidence un biais directionnel systématique des LLMs pour l'ECI, stable au rééchantillonnage. L'ensemble du code est disponible en open-source.
Mots clés : Extraction de relations causales, Agents LLM, Apprentissage zero-shot