talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Mise en correspondance de nomenclatures métiers à partir d’une extraction et d’un alignement des tâches décrites

Geley Mathilde, Estelle Laurence, Gatien Leclercq, Louve Maestre, Anaïs Schlosser

Résumé : Le domaine de l’alignement sémantique automatique consiste à mettre en correspondance des entités issues de ressources d’un même domaine présentant des degrés de formalisation variés. L’alignement de ressources constitue un enjeu pour l’interopérabilité et l’exploitation de données. Les nomenclatures professionnelles sont des références pour l’organisation et la description des activités de travail pourtant elles présentent des structures diverses et des variations lexicales importantes. Notre travail propose une méthode originale de mise en correspondance de ces nomenclatures basée sur un alignement sémantique des tâches associées aux différents métiers plutôt que sur les libellés mêmes des métiers. Pour répondre, nous avons présenté les travaux antérieurs, extrait automatiquement les tâches, puis proposé un alignement fondé sur un modèle transformer, aboutissant à l’alignement de trois ressources. Notre travail ouvre la voie à des recherches sur l’interopérabilité sémantique des nomenclatures professionnelles et l’analyse des proximités entre les métiers et les tâches professionnelles qui leur sont associées.

Mots clés : alignement sémantique, nomenclatures professionnelles