talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Les couleurs des gens

Mathieu Lafourcade, Nathalie Le Brun, Virginie Zampa

Résumé : En TAL et plus particulièrement en analyse sémantique, les informations sur la couleur peuvent être importantes pour traiter correctement des informations textuelles (sens des mots, désambiguïsation et indexation). Plus généralement, connaître la ou les couleurs habituellement associée(s) à un terme est une information cruciale. Dans cet article, nous montrons comment le crowdsourcing, à travers un jeu, peut être une bonne stratégie pour collecter ces données lexico-sémantiques.

Abstract : In Natural Language Processing and semantic analysis in particular, color information may be important in order to properly process textual information (word sense disambiguation, and indexing). More specifically, knowing which colors are generally associated to terms is a crucial information. In this paper, we explore how crowdsourcing through a game with a purpose (GWAP) can be an adequate strategy to collect such lexico-semantic data.

Mots clés : association couleur-mot, réseau lexical, crowdsourcing

Keywords : Word Color Associations, Lexical Network, Crowdsourcing