talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Le traitement automatique de la langue contre les erreurs judiciaires : une méthodologie d’analyse systématique des textes d’un dossier d’instruction

Yannick Toussaint

Résumé : Cet article présente une méthode d’analyse systématique et scientifique des documents constituant un dossier d’instruction. L’objectif de cette approche est de pouvoir donner au juge d’instruction de nouveaux moyens pour évaluer la cohérence, les incohérences, la stabilité ou les variations dans les témoignages. Cela doit lui permettre de définir des pistes pour mener de nouvelles investigations. Nous décrivons les travaux que nous avons réalisés sur un dossier réel puis nous proposons une méthode d’analyse des résultats.

Abstract : This article presents a systematic and scientific method to analyse the set of documents that constitutes a file of instruction. The goal of this approach is to give the examining magistrate new means to estimate the coherence, the incoherence, the stability or the variations in the testimonies. This analysis should help him in identifying the needs for new investigations. We applied our method to a real file and then we propose a way to read the results.

Mots clés : Catégorisation, synthèse, questionnabilité d’un texte, traitement cognitifs d’un texte, traitement automatique de la langue, Justice, dossier d’instruction

Keywords : Text categorisation, text synthesis, text questionning, cognitive treatment of texts, Justice and natural language processing