Polysémie et ambiguité : le cas du verbe Devoir
Anna Colli, Delphine Battistelli
Résumé : Dans cet article nous présentons une approche qui vise à représenter les valeurs sémantiques (ou sens) des occurrences des marqueurs polysémiques qui ne peuvent pas (ou n’ont pas besoin de) être désambiguïsées. Nous appelons cette tâche "représentation (multi-)sens" et nous nous focalisons ici sur le verbe modal devoir. Nous affinons un modèle (CAMEMBERT) pour une tâche de classification multi-label, intégrant une boucle d’active learning pour améliorer le processus d’annotation. En outre, nous démontrons que la combinaison de l’ embedding de la phrase et de l’occurrence de devoir permet au modèle d’obtenir les meilleurs résultats par rapport à une classification basée exclusivement sur l’embedding du token. Finalement, nous avons appliqué le modèle à deux corpus distincts en termes de médium (oral vs écrit) et genre textuel, démontrant ainsi que l’analyse automatique des valeurs modales de devoir permet de mieux les comparer.
Mots clés : modalité,polysémie,ambiguité,sémantique,classification