talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Exploitation de différentes approches pour détecter et catégoriser le vrisque chimique et bactériologique

Natalia Grabar, Thierry Hamon

Résumé : Le risque chimique couvre les situations où les produits chimiques sont ou peuvent être dangereux pour la santé humaine, animale et pour l’environnement. La détection des informations qui concernent le risque des substances chimiques occupe une place importante dans des agences environnementales et les chercheurs. Cependant, d’une part la profusion de données et d’autre part les controverses qui les concernent créent une situation où il devient difficile de trouver rapidement et efficacement les informations pertinentes. Notre objectif consiste à proposer une aide automatique pour l’analyse de la littérature scientifique afin de détecter les phrases indicatives du risque que présentent les substances chimiques ou des bactéries. La tâche est abordée comme un problème de catégorisation : il s’agit de catégoriser les phrases des textes dans les classes du risque lié aux substances. Nous utilisons trois approches : à base de règles, par apprentissage supervisé et la recherche d’information. De meilleurs résultats sont obtenus avec l’apprentissage supervisé et la recherche d’information. En fonction des approches, les résultats obtenus montrent jusqu’à 0,8 de F-mesure.

Mots clés : Risque chimique, catégorisation supervisée, recherche d’information.