talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

LIPN@DEFT2016 : Annotation de documents en utilisant l’Information Mutuelle

Davide Buscaldi, Haïfa Zargayouna

Résumé : Cet article décrit le système proposé par le LIPN pour participer à l’édition 2016 pour le Défi Fouille de Textes. La tâche consiste à proposer des mots clés pour indexer des notices bibliographiques. Quatre domaines de spécialités ont été proposés : linguistique, sciences de l’information, archéologie et chimie. Nous avons proposé trois approches : une approche qui s’appuie sur le volet terminologique des thesaurus, une approche fondée sur l’information mutuelle et une approche qui fusionne les deux. Les mêmes approches ont été appliquées aux quatre domaines de spécialité.

Mots clés : Annotation Sémantique, Information Mutuelle, Fouille de Texte.