talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

La séparation des composantes lexicale et flexionnelle des vecteurs de mots

François Lareau, Gabriel Bernier-Colborne, Patrick Drouin

Résumé : En sémantique distributionnelle, le sens des mots est modélisé par des vecteurs qui représentent leur distribution en corpus. Les modèles étant souvent calculés sur des corpus sans pré-traitement linguistique poussé, ils ne permettent pas de rendre bien compte de la compositionnalité morphologique des mots-formes. Nous proposons une méthode pour décomposer les vecteurs de mots en vecteurs lexicaux et flexionnels.

Abstract : In distributional semantics, the meaning of words is modelled by vectors that represent their distribution in a corpus. Vectorial models being often built from corpora with little linguistic pre-treatment, they do not represent very well the morphological compositionality of words. We propose here a method to decompose semantic vectors into lexical and inflectional vectors.

Mots clés : Sémantique distributionnelle, compositionnalité, flexion

Keywords : Distributional semantics, compositionality, inflection