talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Participation d’Orange Labs à DEFT2017

Aleksandra Guerraz, Nicolas Voisine

Résumé : Cet article décrit la participation d’Orange Labs au DÉfi Fouille de Textes 2017 (DEFT2017). Nous détaillons d’abord notre contribution aux trois tâches proposées par le défi qui sont des problèmes de classification : classification des tweets selon leur polarité en positive, négative, objective, mixte pour les tâches 1 et 3, et classification qui consiste à identifier si le tweet contient ou non du langage figuratif pour la tâche 2. Pour ces trois tâches, nous proposons une méthode qui construit automatiquement les variables à partir de données multi-tables et utilise un classifieur bayésien naïf.

Mots clés : classification bayésienne naïve, données multi-tables, co-clustering, Khiops.