talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Atténuer l'impact de la qualité des références sur l'évaluation des systèmes de résumé grâce aux métriques sans référence

Théo Gigant, Camille Guinaudeau, Marc Decombas, Frédéric Dufaux

Résumé : Les métriques d'évaluation sont utilisées comme des indicateurs pour évaluer les systèmes de résumé abstractif lorsque les annotations sont trop coûteuses. Pour être utiles, ces métriques doivent permettre une évaluation fine, présenter une forte corrélation avec les annotations humaines, et idéalement ne pas dépendre de la qualité des références. Cependant la plupart des métriques d'évaluation standard pour le résumé sont basées sur des références, et les métriques sans références sont faiblement corrélées à la pertinence des résumés, en particulier pour des documents longs. Dans cet article, nous introduisons une métrique sans référence qui corrèle bien avec la pertinence telle qu'évaluée par des humains, tout en étant très peu coûteuse à calculer. Nous montrons également que cette métrique peut être utilisée en complément de métriques basées sur des références afin d'améliorer leur robustesse dans des situations où la qualité des références est faible.

Mots clés : évaluation, résumé abstractif, métrique