Annotation de Marqueurs Discursifs : le cas de la désambiguïsation de après
Paola Herreño Castañeda, Maeva Sillaire
Résumé : Les marqueurs discursifs (désormais MD) sont des expressions souvent polysémiques, voire polyfonctionnelles dans la langue (quoi,enfin, bon, mais, voilà, là, etc.). Dans ce dernier cas, une tâche consiste d'abord à distinguer leurs emplois comme MD et non-MD, en fonction notamment du contexte d'apparition. Dans le cadre de CODIM, un corpus de français a été constitué et annoté semi-automatiquement pour identifier les expressions potentiellement employées comme MD, non-MD, ou MD-CAND (étiquette regroupant les cas ambigus qui n'ont pas pu être déterminés par l'annotation). Nous cherchons à enrichir le processus d'annotation pour les cas où après a été classé comme MD-CAND. Pour cela, nous proposons un protocole d'annotation manuelle supplémentaire visant à trier, parmi ces candidats, les emplois contrastifs et non-contrastifs de après . Nos résultats initient des réflexions plus larges sur les enjeux théoriques et méthodologiques liés à l'annotation des MD.
Mots clés : Marqueur discursif, annotation, corpus, méthodologie.