talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Fouille de graphes sous contraintes linguistiques pour l'exploration de grands textes

Solen Quiniou, Peggy Cellier, Thierry Charnois, Dominique Legallois

Résumé : Dans cet article, nous proposons une approche pour explorer des textes de taille importante en mettant en évidence des sous-parties cohérentes. Cette méthode d’exploration s’appuie sur une représentation en graphe du texte, en utilisant le modèle linguistique de Hoey pour sélectionner et apparier les phrases dans le graphe. Notre contribution porte sur l’utilisation de techniques de fouille de graphes sous contraintes pour extraire des sous-parties pertinentes du texte (c’est-à-dire des collections de sous-réseaux phrastiques homogènes). Nous avons réalisé des expérimentations sur deux textes anglais de taille conséquente pour montrer l’intérêt de l’approche que nous proposons.

Abstract : In this paper, we propose an approach to explore large texts by highlighting coherent sub-parts. The exploration method relies on a graph representation of the text according to the Hoey linguistic model which allows the selection and the binding of sentences in the graph. Our contribution relates to using graph mining techniques under constraints to extract relevant subparts of the text (i.e., collections of homogeneous sentence sub-networks). We have conducted some experiments on two large English texts to show the interest of the proposed approach.

Mots clés : Fouille de graphes, réseaux phrastiques, analyse textuelle, navigation textuelle

Keywords : Graph Mining, sentence networks, textual analysis, textual navigation