talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

FDTB1: Repérage des connecteurs de discours en corpus

Jacques Steinlin, Margot Colinet, Laurence Danlos

Résumé : Cet article présente le repérage manuel des connecteurs de discours dans le corpus FTB (French Treebank) déjà annoté pour la morpho-syntaxe. C'est la première étape de l'annotation discursive complète de ce corpus. Il s'agit de projeter sur le corpus les éléments répertoriés dans LexConn, lexique des connecteurs du français, et de filtrer les occurrences de ces éléments qui n'ont pas un emploi discursif mais par exemple un emploi d'adverbe de manière ou de préposition introduisant un complément sous-catégorisé. Plus de 10 000 connecteurs ont ainsi été repérés.

Abstract : This paper presents the manual identification of discourse connectives in the corpus FTB (French Treebank) already annotated for morpho-syntax. This is the first step in the full discursive annotation of this corpus. The method consists in projecting on the corpus the items that are listed in LexConn, a lexicon of French connectives, and then filtering the occurrences of these elements that do not have a discursive use. More than 10K connectives have been identified.

Mots clés : connecteurs de discours, annotation discursive de corpus, grammaire et discours

Keywords : discourse connectives, discourse annotation, grammar and discourse