Adaptation au domaine pour l'analyse morpho-syntaxique
Éléonor Bartenlian, Margot Lacour, Matthieu Labeau, Alexandre Allauzen, Guillaume Wisniewski, François Yvon
Résumé : Ce travail cherche à comprendre pourquoi les performances d’un analyseur morpho-syntaxiques chutent fortement lorsque celui-ci est utilisé sur des données hors domaine. Nous montrons à l’aide d’une expérience jouet que ce comportement peut être dû à un phénomène de masquage des caractéristiques lexicalisées par les caractéristiques non lexicalisées. Nous proposons plusieurs modèles essayant de réduire cet effet.
Mots clés : Analyse morpho-syntaxique, adaptation au domaine, modèles statistiques, UGC.