talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Fouille de données séquentielles d’itemsets pour l’apprentissage de patrons linguistiques

Peggy Cellier, Thierry Charnois

Résumé : Dans cet article nous présentons une méthode utilisant l’extraction de motifs séquentiels d’itemsets pour l’apprentissage automatique de patrons linguistiques. De plus, nous proposons de nous appuyer sur l’ordre partiel existant entre les motifs pour les énumérer de façon structurée et ainsi faciliter leur validation en tant que patrons linguistiques.

Abstract : In this paper, we present a method based on the extraction of itemset sequential patterns in order to automatically generate linguistic patterns. In addition, we propose to use the partial ordering between sequential patterns to enumerate and validate them.

Mots clés : Fouille de données, motifs séquentiels, extraction d’information, apprentissage de patrons linguistiques

Keywords : Data mining, sequential patterns, information extraction, linguistic pattern learning