talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Aggregation by Conflation of Quasi-Synonymous Units in Author Abstracting

Choy-Kim Chuah

Résumé : La plupart du temps, les études qui portent sur l’aggrégation des phrases en génération de texte, se focalisent sur l’utilisation des connecteurs pour relier les phrases courtes et inventées. Mais, les connecteurs limitent le nombre des unités qu'il est possible de combiner à la fois. Comment condenser l’information en peu d'unités, sans utiliser trop de connecteurs ‘.7 Cette étude porte sur des documents ayant trait à la biologie et discute de l'agrégation des phrases par les auteurs quand ils résument. Cet article présente aussi quelques préalables et difficultés pour un système de résumé automatique. Beaucoup de phrases sont aggrégées sans signe explicite, ni connecteur, ni ponctuation.

Abstract : In text generation, studies on aggregation often focus on the use of connectives to combine short made-up sentences. But connectives restrict the number of units that may be combined at any one time. So, how does information get condensed into fewer units without excessive use of connectives? From a comparison of document and abstract, this reconnaissance study reports on some preferred patterns in aggregation when authors write abstracts for journal articles on biology. The paper also discusses some prerequisites and difficulties anticipated for abstracting systems. More sentences were aggregated without than with the use of an explicit sign, such as a connective or a (semi-)colon.

Keywords : abstracting, sentence, aggregation, synonymy, conflation