talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Étude des variations sémantiques à travers plusieurs dimensions

Syrielle Montariol, Alexandre Allauzen

Résumé : Au sein d’une langue, l’usage des mots varie selon deux axes : diachronique (dimension temporelle) et synchronique (variation selon l’auteur, la communauté, la zone géographique... ). Dans ces travaux, nous proposons une méthode de détection et d’interprétation des variations d’usages des mots à travers ces différentes dimensions. Pour cela, nous exploitons les capacités d’une nouvelle ligne de plongements lexicaux contextualisés, en particulier le modèle BERT. Nous expérimentons sur un corpus de rapports financiers d’entreprises françaises, pour appréhender les enjeux et préoccupations propres à certaines périodes, acteurs et secteurs d’activités.

Mots clés : Diachronie, Variation sémantique, Plongements lexicaux contextualisés, Clustering.