Comment arpenter sans mètre : les scores de résolution de chaînes de coréférences sont-ils des métriques ?
Adam Lion-Bouton, Loïc Grobol, Jean-Yves Antoine, Sylvie Billot, Anaïs Lefeuvre-Halftermeyer
Résumé : Cet article présente un travail qui consiste à étudier si les scores les plus utilisés pour l’évaluation de la résolution des coréférences constituent des métriques de similarité normalisées. En adoptant une démarche purement expérimentale, nous avons vérifié si les scores MUC, B3 , CEAF, BLANC, LEA et le meta-score CoNLL respectent les bonnes propriétés qui définissent une telle métrique. Notre étude montre que seul le score CEAFm est potentiellement une métrique de similarité normalisée.
Mots clés : coréférence, évaluation, métrique de similarité, MUC, B3 , CEAF, BLANC, LEA, CoNLL.