talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Détection de périodes musicales d’une collection de musique par apprentissage

Rémy Kessler, Nicolas Béchet, Audrey Laplante, Dominic Forest

Résumé : Dans ces travaux, nous présentons une approche afin d’étiqueter une large collection de chansons francophones. Nous avons développé une interface utilisant les paroles comme point d’entrée afin d’explorer cette collection de musique avec des filtres en fonction de chaque période musicale. Dans un premier temps, nous avons collecté paroles et métadonnées de différentes sources sur leWeb. Nous présentons dans cet article une méthode originale permettant d’attribuer de manière automatique la décennie de sortie des chansons de notre collection. Basée sur un système évalué au cours d’une des campagnes DEFT, l’approche combine fouille de textes et apprentissage supervisé et aborde la problématique comme une tâche de classification multi classes. Nous avons par la suite enrichi le modèle d’un certain nombre de traits supplémentaires tels que les tags sociaux afin d’observer leur influence sur les résultats.

Abstract : In this paper, we present an approach to label a large collection of songs in French by decade. We have developed an information visualization interface that allows users to browse the collection searching for lyrics with musical periods dependent filters. We first harvested lyrics and metadata from various sources on the web. We present in this article an original method to automatically assign the decade of songs for our collection. The original system was developed for a DEFT challenge and combined text mining and machine learning with a multi class approach. We subsequently enriched the model with additional features such as social tags to determine their impact on the results.

Mots clés : Fouille de textes, apprentissage supervisé, paroles de chansons, tags sociaux

Keywords : text mining, machine learning, lyrics, social tagging