talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Annotateurs volontaires investis et éthique de l'annotation de lettres de suicidés

Kevin B. Cohen, John Pestian, Karën Fort

Résumé : Cet article présente une perspective éthique sur le projet décrit dans (Pestian et al., 2012b). La campagne d'annotation en question a visé à produire un corpus de lettres de suicidés annotées en émotions. Les annotateurs étaient soit des parents ou des amis de suicidés, soit des professionnels de la santé mentale. Nous appelons ces annotateurs bénévoles, volontaires pour faire avancer la recherche, des volontaires investis. Ce projet soulève un certain nombre de questions éthiques, notamment en ce qui concerne le rôle de l'empathie des annotateurs, les effets possibles sur ceux-ci et les utilisations potentielles des résultats obtenus. Nous concluons par une analyse du corpus du point de vue de la Charte Éthique et Big Data.

Abstract : According to the World Health Organization, 800,000 people die of suicide every year. About 20% of them leave a written message. This paper discusses a corpus of such messages. The corpus was annotated with reference to the emotions expressed in the notes. The annotators were family or friends of someone who had died by suicide, or mental health professionals. We refer to these non-coercivally and altruistically motivated annotators as vested volunteers. A number of ethical issues are explored with this task and group of annotators, including the role of empathy, possible effects on the annotators, and the uses that might be made of the products of the annotation project. We conclude considering the project from the point of view of the Ethics and Big Data Charter.

Mots clés : lettres de suicidés, éthique, annotation, myriadisation, corpus

Keywords : suicide notes, ethics, annotation, crowdsourcing, corpus