talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Une approche exploratoire de compression automatique de phrases basée sur des critères thermodynamiques

Silvia Fernández Sabido, Juan-Manuel Torres-Moreno

Résumé : Nous présentons une approche exploratoire basée sur des notions thermodynamiques de la Physique statistique pour la compression de phrases. Nous décrivons le modèle magnétique des verres de spins, adapté à notre conception de la problématique. Des simulations Métropolis Monte-Carlo permettent d’introduire des fluctuations thermiques pour piloter la compression. Des comparaisons intéressantes de notre méthode ont été réalisées sur un corpus en français.

Abstract : We present an exploratory approach based on thermodynamic concepts of Statistical Physics for sentence compression.We describe the magnetic model of spin glasses, well suited to our conception of problem. The Metropolis Monte-Carlo simulations allow to introduce thermal fluctuations to drive the compression. Interesting comparisons of our method were performed on a French text corpora.

Mots clés : Compression de phrases, Résumé automatique, Résumé par extraction, Enertex, Mécanique statistique

Keywords : Sentence Compression, Automatic Summarization, Extraction Summarization, Enertex, Statistical Mechanics