talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Vers une nouvelle structuration de l’information extraite automatiquement

Alejandro Acosta

Résumé : Les systèmes d’Extraction d’Information se contentent, le plus souvent, d’enrichir des bases de données plates avec les informations qu’ils extraient. Nous décrivons dans cet article un travail en cours sur l’utilisation de données extraites automatiquement pour la construction d’une structure de représentation plus complexe. Cette structure modélise un réseau social composé de relations entre les entités d’un corpus de biographies.

Abstract : Information Extraction systems are widely used to create flat databases of templates filled with the data they extract from text. In this article we describe an ongoing research project that focuses on the use of automatically extracted data to create a more complex representation structure. This structure is a model of the social network underlying the relations that can be established between the entities of a corpus of biographies.

Mots clés : extraction d’information, analyse de réseaux sociaux, biographies, entités nommées, représentation de connaissances

Keywords : information extraction, social network analysis, named entities, biographies, knowledge representation