talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Étude Expérimentale d’Extraction d’Information dans des Retranscriptions de Réunions

Pegah Alizadeh, Peggy Cellier, Thierry Charnois, Bruno Cremilleux, Albrecht Zimmermann

Résumé : Nous nous intéressons dans cet article à l’extraction de thèmes à partir de retranscriptions textuelles de réunions. Ce type de corpus est bruité, il manque de formatage, il est peu structuré avec plusieurs locuteurs qui interviennent et l’information y est souvent éparpillée. Nous présentons une étude expérimentale utilisant des méthodes fondées sur la mesure tf-idf et l’extraction de topics sur un corpus réel de référence (le corpus AMI) pour l’étude de réunions. Nous comparons nos résultats avec les résumés fournis par le corpus.

Mots clés : Extraction d’information, corpus de dialogue, détection de thèmes.