talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Segmentation en thèmes de conversations téléphoniques : traitement en amont pour l’extraction d’information

Narjès Boufaden, Guy Lapalme, Yoshua Bengio

Résumé : Nous présentons une approche de découpage thématique que nous utiliserons pour faciliter l’extraction d’information à partir de conversations téléphoniques transcrites. Nous expérimentons avec un modèle de Markov caché utilisant des informations de différents niveaux linguistiques, des marques d’extra-grammaticalités et les entités nommées comme source additionnelle d’information. Nous comparons le modèle obtenu avec notre modèle de base utilisant uniquement les marques linguistiques et les extra-grammaticalités. Les résultats montrent l’efficacité de l’approche utilisant les entités nommées.

Abstract : We study the problem of topic segmentation as a means to facilitate information extraction from manually transcribed convesrations.We experiment with a first orderHMMusing a combination of linguistic-level cues and named entities. We compare the results of our linguistic-levels cues based model with the named entities based model. Results show the effectiveness of named entities as an additional source of information for topic segmentation.

Mots clés : segmentation en thèmes, analyse des conversations, extraction d’information

Keywords : topic segmentation, conversation analysis, information extraction