talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Analyse automatique de sondages téléphoniques d’opinion

Nathalie Camelin, Frédéric Béchet, Géraldine Damnati, Renato De Mori

Résumé : Cette étude présente la problématique de l’analyse automatique de sondages téléphoniques d’opinion. Cette analyse se fait en deux étapes : tout d’abord extraire des messages oraux les expressions subjectives relatives aux opinions de utilisateurs sur une dimension particulière (efficacité, accueil, etc.) ; puis sélectionner les messages fiables, selon un ensemble de mesures de confiance, et estimer la distribution des diverses opinions sur le corpus de test. Le but est d’estimer une distribution aussi proche que possible de la distribution de référence. Cette étude est menée sur un corpus de messages provenant de vrais utilisateurs fournis par France Télécom R&D.

Abstract : This paper introduces the context of the automatic analysis of opinion telephone surveys. This analysis is done by means of two stages : firstly the subjective expressions, related to the expression of an opinion on a particular dimension (efficiency, courtesy, . . . ), are extracted from the audio messages ; secondly the reliable messages, according to a set of confidence measures, are selected and the distribution of the positive and negative opinions in these messages is estimated. The goal is to obtain a distribution as close as possible to the reference one. This study is carried on a telephone survey corpus, provided by France Télécom R&D, obtained in real field conditions.

Mots clés : détection d’opinions, classification automatique, reconnaissance automatique de la parole, champs conditionnels aléatoires

Keywords : opinion extraction, automatic classification, automatic speech recognition, conditional random fields