Exploration de traits pour la reconnaissance d'entités nommées du Français par apprentissage automatique
Yoann Dupont
Résumé : Dans cet article, nous explorons divers traits proposés dans la littérature afin de fournir un détecteur d'entités nommées pour le Français appris automatiquement sur le French Treebank. Nous étudions l'intégration de connaissances en domaine, l'apport de la classification des verbes, la gestion des mots inconnus et l'intégration de traits non locaux. Nous comparons ensuite notre système aux récents réseaux de neurones.
Mots clés : Reconnaissance d'entités nommées,French Treebank,Apprentissage automatique,CRF,réseaux de neurones