talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Exploration de traits pour la reconnaissance d'entités nommées du Français par apprentissage automatique

Yoann Dupont

Résumé : Dans cet article, nous explorons divers traits proposés dans la littérature afin de fournir un détecteur d'entités nommées pour le Français appris automatiquement sur le French Treebank. Nous étudions l'intégration de connaissances en domaine, l'apport de la classification des verbes, la gestion des mots inconnus et l'intégration de traits non locaux. Nous comparons ensuite notre système aux récents réseaux de neurones.

Mots clés : Reconnaissance d'entités nommées,French Treebank,Apprentissage automatique,CRF,réseaux de neurones