talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

LDApol: vers une méthodologie de contextualisation des discours politiques

Jeanne Vermeirsche, Eric Sanjuan, Tania Jiménez

Résumé : Nous comparons les distributions de mots dans les communiqués de presse politiques récents. Nous proposons une méthodologie pour objectiver des associations entre notions participant au débat politique. Nous montrons comment les modèles de langage probabilistes peuvent révéler les concepts sous-jacents en tant qu’associations fortes à plusieurs termes pour aider à clarifier le débat politique, notamment pour la surveillance des médias sociaux. Cette approche tente de modéliser les termes du débat comme des distributions de probabilités d’apparition des mots.

Mots clés : Contextualisation - Nationalisme - Polarisation - Discours politiques - LDA - corpus - modélisation.