talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Analyse quantitative et qualitative de citations extraites d’un corpus journalistique

Fabien Poulard

Résumé : Dans le contexte de la détection de plagiats, le repérage de citations et de ses constituants est primordial puisqu’il peut aider à évaluer le caractère licite ou illicite d’une reprise (source citée ou non). Nous proposons ici une étude quantitative et qualitative des citations extraites d’un corpus que nous avons auparavant construit. Cette étude a pour but de tracer des axes de recherche vers une méthode de repérage automatique des citations.

Abstract : In the plagiarism detection context, finding citations and their components is essential as it may help estimating legal value of a copy (with or without original source specified). We propose here a quantitative and qualitative study of citations we extracted from a corpus we previously built. This study aims at orienting our research towards an efficient automatic citations extraction method.

Mots clés : citations, contruction et étude de corpus, genre journalistique

Keywords : citations, corpus creation and analysis, journalistic genre