talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Désambiguïsation d'entités pour l'induction non supervisée de schémas événementiels

Kiem-Hieu Nguyen, Xavier Tannier, Olivier Ferret, Romaric Besançon

Résumé : Cet article présente un modèle génératif pour l'induction non supervisée d'événements. Les précédentes méthodes de la littérature utilisent uniquement les têtes des syntagmes pour représenter les entités. Pourtant, le groupe complet (par exemple, "un homme armé") apporte une information plus discriminante (que "homme"). Notre modèle tient compte de cette information et la représente dans la distribution des schémas d'événements. Nous montrons que ces relations jouent un rôle important dans l'estimation des paramètres, et qu'elles conduisent à des distributions plus cohérentes et plus discriminantes. Les résultats expérimentaux sur le corpus de MUC-4 confirment ces progrès.

Abstract : In this paper, we present an approach for event induction with a generative model. This model makes possible to consider more relational information than previous models, and has been applied to noun attributes. By their influence on parameter estimation, this new information make probabilistic topic distribution more discriminative and more robust. We evaluated different versions of our model on MUC-4 datasets.

Mots clés : Événements, modèle génératif, désambiguïsation d'entités, échantillonnage de Gibbs

Keywords : Event Induction, Generative Model, Entity Disambiguation, Gibbs Sampling