talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Traitement automatique des évènements médiatiques : Détection, classification, segmentation et recherche sémantique

Abdelkrim Beloued

Résumé : Cet article présente une méthodologie pour l'analyse automatique des évènements rapportés par les médias. Elle s'appuie sur des techniques de traitement automatique des langues, notamment la représentation sémantique des contenus médiatiques, la classification thématique, l'extraction d'évènements à partir de flux d'information, ainsi que la détection d'évènements par regroupement de représentations vectorielles issues de modèles de plongement sémantique. L'approche combine des modèles supervisés et non supervisés ainsi que des architectures capables de prendre en compte un contexte large. Plusieurs corpus sont utilisés pour l'entraînement et l'évaluation de ces modèles. Les résultats obtenus montrent une efficacité élevée dans la détection, le regroupement, la classification thématique et la recherche sémantique des évènements médiatiques. Cette approche offre ainsi des perspectives significatives pour structurer les faits réels, analyser leur représentation médiatique et comprendre l'influence exercée par les médias sur le traitement de ces faits.

Mots clés : Évènements médiatiques, Apprentissage contrastif, Détection d'évènements, Classification, Segmentation, Recherche sémantique