talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Identification des composants temporels pour la représentation des dépêches épidémiologiques

Manal El Zant, Liliane Pellegrin, Hervé Chaudet, Michel Roux

Résumé : Dans le cadre du projet EpidémIA qui vise à la construction d’un système d’aide à la décision pour assister l’utilisateur dans son activité de gestion des risques sanitaires, un travail préalable sur la compositionalité des évènements (STEEL) nous a permis d’orienter notre travail dans le domaine de la localisation d’information spatio-temporelle. Nous avons construit des graphes de transducteurs pour identifier les informations temporelles sur un corpus de 100 dépêches de la langue anglaise de ProMed. Nous avons utilisé le système d’extraction d’information INTEX pour la construction de ces transducteurs. Les résultats obtenus présentent une efficacité de ces graphes pour l’identification des données temporelles.

Abstract : EpidémIA project aims to the construction of a computerized decision-making system to assist user in his activity of medical risk management. A preliminary work on the events compositionality (STEEL) enables us to direct our work in the field of the space-time information localization. We have created some transducers graphs to identify temporal information on a corpus of 100 SARS ProMed English reports. We used the extraction information system INTEX to construct these transducers. The results obtained present an effectiveness of these graphs to identify temporal data.

Mots clés : Analyse de textes, structure des évènements, extraction d’information, sémantique du temps

Keywords : Text analysis, event structure, extraction information, temporal semantics