talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Classification de relation pour la génération de mots-clés absents

Maël Houbre, Florian Boudin, Béatrice Daille

Résumé : Les modèles encodeur-décodeur constituent l'état de l'art en génération de mots-clés. Cependant, malgré de nombreuses adaptations de cette architecture, générer des mots-clés absents du texte du document est toujours une tâche difficile. Cette étude montre qu'entraîner au préalable un modèle sur une tâche de classification de relation entre un document et un mot-clé, permet d'améliorer la génération de mots-clés absents.

Mots clés : Analyse de documents scientifiques