talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

La segmentation thématique TextTiling comme indice pour le repérage de segments d'information évolutive dans un corpus de textes encyclopédiques

Marion Laignelet, Christophe Pimm

Résumé : Nous faisons l'hypothèse que les bornes délimitées par la méthode statistique TextTiling peuvent servir d'indices qui, cumulées à des indices de nature linguistique, permettront de repérer automatiquement des segments d'informations évolutives. Ce travail est développé dans le cadre d'un projet industriel plus général dont le but est le repérage automatique de zones textuelles contenant de l'information potentiellement évolutive.

Abstract : Our hypothesis is that the TextTiling's boundaries can be considered as clues we can use with other linguistic features to automatically detect evolving information segments. This work is developed as part of an industrial project aiming to automatically detect textual zones containing potentially evolving information.

Mots clés : segments d'information évolutive, segmentation, algorithme TextTiling

Keywords : evolving information, segmentation, TextTiling algorithm