talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Indexation automatique de notices bibliographiques à l’aide d’approches d’acquisition terminologique

Thierry Hamon

Résumé : Nous présentons dans cet article le système mis au point pour participer à la campagne DEFT 2016. Cette campagne ayant des objectifs similaires à celle de 2012, nous avons adapté le système utilisé pour DEFT 2012, afin de répondre aux contraintes de ce nouveau défi. Ainsi, les termes proposés par des approches d’acquisition terminologique sont regroupés en fonction de relations qu’ils entretiennent entre eux, puis sélectionnés à partir de leur position dans le texte et du vocabulaire qui les compose. Nous avons également tenté de prédire le nombre de mots-clés à l’aide d’un modèle de régression linéaire. Différentes configurations du système ont été appliquées à quatre domaines de spécialité. Les F-mesures des meilleures configurations varient entre 12,49 et 43,26.

Mots clés : Mots-clés, acquisition terminologique, indexation contrôlée, extraction de termes.