talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Adaptation au domaine pour l'analyse morpho-syntaxique

Éléonor Bartenlian, Margot Lacour, Matthieu Labeau, Alexandre Allauzen, Guillaume Wisniewski, François Yvon

Résumé : Ce travail cherche à comprendre pourquoi les performances d’un analyseur morpho-syntaxiques chutent fortement lorsque celui-ci est utilisé sur des données hors domaine. Nous montrons à l’aide d’une expérience jouet que ce comportement peut être dû à un phénomène de masquage des caractéristiques lexicalisées par les caractéristiques non lexicalisées. Nous proposons plusieurs modèles essayant de réduire cet effet.

Mots clés : Analyse morpho-syntaxique, adaptation au domaine, modèles statistiques, UGC.