talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Décontextualiser des plongements contextuels pour construire des thésaurus distributionnels

Olivier Ferret

Résumé : Même si les modèles de langue contextuels sont aujourd’hui dominants en traitement automatique des langues, les représentations qu’ils construisent ne sont pas toujours adaptées à toutes les utilisations. Dans cet article, nous proposons une nouvelle méthode pour construire des plongements statiques à partir de modèles contextuels. Cette méthode combine la généralisation et l’agrégation des représentations contextuelles. Nous l’évaluons pour un large ensemble de noms en anglais dans la perspective de la construction de thésaurus distributionnels pour l’extraction de relations de similarité sémantique. Finalement, nous montrons que les représentations ainsi construites et les plongements statiques natifs peuvent être complémentaires.

Mots clés : Plongements statiques et contextuels, similarité, thésaurus distributionnel.