talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Ordonner un résumé automatique multi-documents fondé sur une classification des phrases en classes lexicales

Aurélien Bossard, Émilie Guimier De Neef

Résumé : Nous présentons différentes méthodes de réordonnancement de phrases pour le résumé automatique fondé sur une classification des phrases à résumer en classes thématiques. Nous comparons ces méthodes à deux baselines : ordonnancement des phrases selon leur pertinence et ordonnancement selon la date et la position dans le document d'origine. Nous avons fait évaluer les résumés obtenus sur le corpus RPM2 par 4 annotateurs et présentons les résultats.

Abstract : We present several sentence ordering methods for automatic summarization which are specific to multi-document summarizers, based on sentences subtopic clustering. These methods are compared to two baselines : sentence ordering according to pertinence and according to publication date and inner document position. The resulting summaries on RPM2 corpus have been evaluated by four judges.

Mots clés : Résumé automatique, ordonnancement de phrases

Keywords : Automatic summarization, sentence ordering