Participation d’Orange Labs à DEFT2017
Aleksandra Guerraz, Nicolas Voisine
Résumé : Cet article décrit la participation d’Orange Labs au DÉfi Fouille de Textes 2017 (DEFT2017). Nous détaillons d’abord notre contribution aux trois tâches proposées par le défi qui sont des problèmes de classification : classification des tweets selon leur polarité en positive, négative, objective, mixte pour les tâches 1 et 3, et classification qui consiste à identifier si le tweet contient ou non du langage figuratif pour la tâche 2. Pour ces trois tâches, nous proposons une méthode qui construit automatiquement les variables à partir de données multi-tables et utilise un classifieur bayésien naïf.
Mots clés : classification bayésienne naïve, données multi-tables, co-clustering, Khiops.