talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Repérage de segments d’information évolutive dans des documents de type encyclopédique

Marion Laignelet

Résumé : Dans cet article, nous cherchons à caractériser linguistiquement des segments textuels définis pragmatiquement, relativement à des besoins de réédition de documents et au sein desquels l’information est susceptible d’évoluer dans le temps. Sur la base d’un corpus de textes encyclopédiques en français, nous analysons la distribution de marqueurs textuels et discursifs et leur pertinence en nous focalisant principalement sur un traitement sémantique particulier de la temporalité.

Abstract : In this paper, we present a method for the automatic identification of text segments carrying information likely to evolve in the course of time. In a corpus of extracts from French encyclopediae, we analyse relevant text and discourse markers focussing on a specific approach to temporal semantics.

Mots clés : repérage automatique d’informations évolutives, TAL, corpus de textes encyclopédiques, marqueurs textuels et discursifs

Keywords : automatic identification of evolving information, NLP, corpus of encyclopaedic texts, textual and discourse markers