talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Le corpus NeWMe : un corpus de référence pour l’étude de la négociation du sens des mots

Aina Garí Soler, Jenny Myrendal, Chloé Clavel, Staffan Larsson

Résumé : Les séquences de négociation du sens des mots (*Word Meaning Negotiation*, WMN) apparaissent lorsque des interlocuteurs se concentrent sur la clarification ou la négociation du sens d’un mot ou d’une expression. Ces interactions orientent temporairement la conversation vers l'exploration des nuances de sens, menant à des clarification rapides ou à des débats plus approfondis. Cet article présente le plus grand corpus de WMN librement accessible annoté manuellement. Il comprend des conversations orales dyadiques et multipartites ainsi que des débats en ligne. Notre méthodologie combine une recherche par expressions régulières avec un schéma d’annotation distinguant plusieurs types de WMN, notamment celles déclenchées par une non-compréhension (NONs) ou un désaccord (DINs), ainsi que des phénomènes connexes. Les analyses révèlent des tendances selon les contextes : les NONs sont plus fréquentes à l’oral, tandis que les DINs dominent en ligne. Cette ressource contribue à l’étude de l’alignement sémantique et à l’identification des WMN.

Mots clés : Négociation du sens des mots, WMN, alignement sémantique, coordination séman- tique, linguistique interactionnelle, malentendu