talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Des outils de TAL en support aux experts de sûreté industrielle pour l’exploitation de bases de données de retour d’expérience

Nikola Tulechki

Résumé : Cet article présente des applications d’outils et méthodes du traitement automatique des langues (TAL) à la maîtrise du risque industriel grâce à l’analyse de données textuelles issues de volumineuses bases de retour d’expérience (REX). Il explicite d’abord le domaine de la gestion de la sûreté, ses aspects politiques et sociaux ainsi que l’activité des experts en sûreté et les besoins qu’ils expriment. Dans un deuxième temps il présente une série de techniques, comme la classification automatique de documents, le repérage de subjectivité, et le clustering, adaptées aux données REX visant à répondre à ces besoins présents et à venir, sous forme d’outils, en support à l’activité des experts.

Abstract : This article presents a series of natural language processing (NLP) techniques, applied to the domain of industrial risk management and the analysis of large collections of textual feedback data. First we describe the socio-political aspects of the risk mangement domain, the activity of the investigators working with this data. We then present present applications of NLP techniques like automatic text classification, clustering and opinion extraction, responding to different needs stated by the investigators.

Mots clés : REX, rapport d’incident, risque, sûreté industrielle, signaux faibles, classification automatique, clustering, recherche d’information, similarité, subjectivité

Keywords : risk management, incident report, industrial safety, weak signals, automatic classification, information retrieval, similarity, clustering, subjectivity