talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Indexation discursive pour la navigation intradocumentaire : cadres temporels et spatiaux dans l’information géographique

Frédérik Bilhaut, Lydia-Mai Ho-Dac, Andrée Borillo, Thierry Charnois, Patrice Enjalbert, Anne Le Draoulec, Yann Mathet, Hélène Miguet, Marie-Paule Péry-Woodley, Laure Sarda

Résumé : Cet article concerne la structuration automatique de documents par des méthodes linguistiques. De telles procédures sont rendues nécessaires par les nouvelles tâches de recherche d’information intradocumentaires (systèmes de questions-réponses, navigation sélective dans des documents...). Nous développons une méthode exploitant la théorie de l’encadrement du discours de Charolles, avec une application visée en recherche d’information dans les documents géographiques - d’où l’intérêt tout particulier porté aux cadres spatiaux et temporels. Nous décrivons une implémentation de la méthode de délimitation de ces cadres et son exploitation pour une tâche d’indexation intratextuelle croisant les critères spatiaux et temporels avec des critères thématiques.

Abstract : This paper proposes linguistics-based methods for the automatic identification of text segments. Such procedures are required by new tasks appearing in intra-document information retrieval (question-answer systems, selective browsing). Our method is based on Charolles’ theory of discourse framing and focuses on temporal and spatial frames. We describe an implementation of our method for determining frame boundaries and its exploitation for intradocument indexing combining spatial, temporal and thematic criteria.

Mots clés : Analyse automatique de discours, Cadres de discours, Recherche d’information, Document géographique

Keywords : Automatic discourse analysis, Discourse framing, Information retrieval, Geographical documents