talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

DEFT 2020 : détection de similarité entre phrases et extraction d'information

Mike Tapi Nzali

Résumé : Ce papier décrit la participation de Reezocar à la campagne d’évaluation DEFT 2020. Cette seizième édition du challenge a porté sur le calcul de similarité entre phrases et l’extraction d’information fine autour d’une douzaine de catégories dans des textes rédigés en Français. Le challenge propose trois tâches : (i) la première concerne l’identification du degré de similarité entre paires de phrases ; (ii) la deuxième concerne l’identification des phrases parallèles possibles pour une phrase source et (iii) la troisième concerne l’extraction d’information. Nous avons utilisé des méthodes d’apprentissage automatique pour effectuer ces tâches et avons obtenu des résultats satisfaisants sur l’ensemble des tâches.

Mots clés : détection de similarité sémantique, extraction d’information, apprentissage automatique.