talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Just What May be Deleted or Compressed in Abstracting?

Choy-Kim Chuah

Résumé : Les résumés constitués de phrases extraites d'un texte contiennent souvent des mots inutiles, il est possible de les éliminer ou d'en réduire le nombre. Par un étude comparative des phrases du documents et des phrases correspondantes dans le résumé, cet article présente un inventaire partiel des unités qui sont souvent éliminées ou réduites en nombre. Les metadiscours, les textes entre parenthèses, les unités redondantes (emphases, répétitions), les appositions, modifieurs et relatives ne sont pas a place dans un résumé.

Abstract : Abstracts constituted from extracted sentences contain unneeded information that may be deleted, or compressed into simpler units. By comparing full text sentences used in abstracting with correspond-ing sentences in abstract, the study found such units to include metadiscourse phrases, parenthetical texts, redundant units inserted for emphasis, or are repetitions. Apposed texts and units such as modifiers and relative clauses which provide details and precision in the full text, but are out of place in an abstract, are also deleted.

Keywords : abstracting, deletion, compression, metadiscourse, redundancy