talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Système d'extraction d'information dédié à la veille Qui est qui? Qui fait quoi? Où? Quand? Comment?

Asma Bouhafs

Résumé : Dans cet article nous présentons un outil d’extraction d’information dédié à la veille qui répond à un certain nombre de requêtes formulées par l'utilisateur, en combinant la puissance des outils et les ressources informatiques à une analyse linguistique. Cette analyse linguistique permet le repérage des entités nommées (acteurs, lieux, temps,…) ainsi que la mise en relation des acteurs avec leur environnement dans l'espace et le temps au moyen d'indices déclencheurs, d’indices complémentaires et de règles qui les combinent, c'est le principe de l'Exploration Contextuelle. Les résultats capitalisés dans des fichiers XML, sont proposés par le biais d’une interface, soit sous forme de graphes soit sous forme de base d'informations.

Abstract : In this article we present an information extraction tool which answers a certain number of requests formulated by the user, by combining data-processing with a linguistic analysis. This linguistic analysis allows the location of the named entities (actors, places, time...) thus the relations between actors and their environments in space and time by means of indices, indicators and rules which combine them, it is the principle of Contextual Exploration. The results capitalized in XML files are presented in an interface, either in the form of graphs or in the form of databases.

Mots clés : Classes sémantiques, Extraction d’information, Exploration Contextuelle, Ressources, Réseau sémantique

Keywords : Semantic classes, Information Extraction, Contextual Exploration, Resources, Semantic network