talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Anonymisation de décisions de justice

Luc Plamondon, Guy Lapalme, Frédéric Pelletier

Résumé : La publication de décisions de justice sur le Web permet de rendre la jurisprudence accessible au grand public, mais il existe des domaines du droit pour lesquels la Loi prévoit que l’identité de certaines personnes doit demeurer confidentielle. Nous développons actuellement un système d’anonymisation automatique à l’aide de l’environnement de développement GATE. Le système doit reconnaître certaines entités nommées comme les noms de personne, les lieux et les noms d’entreprise, puis déterminer automatiquement celles qui sont de nature à permettre l’identification des personnes visées par les restrictions légales à la publication.

Abstract : Publishing court decisions on theWeb can make case law available to the general public, but the Law sometimes prohibits the disclosure of the identity of people named in decisions. We are currently developing an automatic anonymization system, using the GATE development environment. The tasks of the system are the recognition of some named entities like person names, locations and company names, then the automatic selection of the ones that may lead to the identification of people whose identities must be legally kept confidential.

Mots clés : Anonymisation, désidentification, reconnaissance d’entités nommées, textes juridiques

Keywords : Anonymization, de-identification, named entity recognition, law texts