Construction de lexiques pour l’extraction des mentions de maladies dans les forums de santé
Elise Bigeard
Résumé : Les forums de discussion et les réseaux sociaux sont des sources potentielles de différents types d’information, qui ne sont en général pas accessibles par ailleurs. Par exemple, dans les forums de santé, il est possible de trouver les informations sur les habitudes et le mode de vie des personnes. Ces informations sont rarement partagées avec les médecins. Il est donc possible de se fonder sur ces informations pour évaluer les pratiques réelles des patients. Il s’agit cependant d’une source d’information difficile à traiter, essentiellement à cause des spécificités linguistiques qu’elle présente. Si une première étape pour l’exploration des forums consiste à indexer les termes médicaux présents dans les messages avec des concepts issus de terminologies médicales, cela s’avère extrêmement compliqué car les formulations des patients sont très différentes des terminologies officielles. Nous proposons une méthode permettant de créer et enrichir des lexiques de termes et expressions désignant une maladie ou un trouble, avec un intérêt particulier pour les troubles de l’humeur. Nous utilisons des ressources existantes ainsi que des méthodes non supervisées. Les ressources construites dans le cadre du travail nous permettent d’améliorer la détection de messages pertinents.
Mots clés : Traitement automatique du langage, forums de discussion, extraction, terminologies, langage patient, maladies.