talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Q-learning pour la résolution des anaphores pronominales en langue arabe

Saoussen Mathlouthi Bouzid, Chiraz Ben Othmane Zribi

Résumé : La résolution d’anaphores est une tâche fondamentale pour la plupart des applications du TALN. Cette tâche reste un problème difficile qui nécessite plusieurs sources de connaissances et des techniques d’apprentissage efficaces, notamment pour la langue arabe. Cet article présente une nouvelle approche de résolution d’anaphores pronominales dans les textes arabes en se basant sur une méthode d’Apprentissage par Renforcement AR qui utilise l’algorithme Q-learning. Le processus de résolution comporte une étape d’identification des pronoms et des antécédents candidats et une autre de résolution. L'algorithme Q-learning permet d’apprendre dans un environnement dynamique et incertain. Il cherche à optimiser pour chaque pronom anaphorique, une séquence de choix de critères pour évaluer les antécédents et sélectionner le meilleur. Le système de résolution est évalué sur des textes littéraires, des textes journalistiques et des manuels techniques. Le taux de précision atteint jusqu’à 77,14%.

Mots clés : résolution d’anaphores, apprentissage par renforcement, Q-learning, critères morphosyntaxiques, arabe.