talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Cartographie de Textes: Une aide à l’utilisateur dans le cadre de la découverte de nouveaux domaines

Isabelle Debourges, Sylvie Guilloré-Billot, Christel Vrain

Résumé : Nous présentons les avancées d’un projet dans un thème que nous qualifions de Cartographie de Textes qui permet à l’utilisateur novice d’explorer un nouveau domaine par navigation au sein d’un corpus homogène grâce à des cartes conceptuelles interactives. Une carte est composée de concepts pertinents relativement à la requête initiale et à son évolution, au sein du corpus; des relations extraites du corpus les lient aux mots de la requête. Des techniques d’apprentissage automatique sont combinées avec des heuristiques statistiques de Traitement Automatique des Langues pour la mise en évidence de collocations afin de construire les cartes.

Abstract : We present an ongoing research project on the new field of Text Mapping that allows a novice user to explore a new domain by navigation through an homogeneous corpus thanks to interactive conceptual maps. A map is composed of concepts (the nodes) depending on the user’s request and its evolution, and semantic/lexical relations (the links). Machine Learning techniques are combined with Natural Language Processing methodologies to build the maps.

Mots clés : Cartographie de Textes, Recherche d’Information, Extraction d’Information, Apprentissage Automatique

Keywords : Text Mapping, Information Retrieval, Information Extraction, Machine Learning