talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Auto-apprentissage et renforcement pour une analyse jointe sur données disjointes : étiquetage morpho-syntaxique et analyse syntaxique

Fang Zhao, Timothée Bernard

Résumé : Cet article se penche sur l'utilisation de données disjointes pour entraîner un système d'analyse jointe du langage naturel. Dans cette étude exploratoire, nous entraînons un système à prédire un étiquetage morpho-syntaxique et une analyse syntaxique en dépendances à partir de phrases annotées soit pour l'une de ces tâches, soit pour l'autre. Deux méthodes sont considérées : l'auto-apprentissage et l'apprentissage par renforcement, pour lequel nous définissons une fonction de récompense encourageant le système à effectuer des prédictions même sans supervision. Nos résultats indiquent de bonnes performances dans le cas où les données disjointes sont issues d'un même domaine, mais sont moins satisfaisants dans le cas contraire. Nous identifions des limitations de notre implémentation actuelle et proposons en conséquence des pistes d'amélioration.

Mots clés : apprentissage semi, supervisé, apprentissage par renforcement, multi, tâche, analyse jointe, étiquetage morpho, syntaxique, analyse syntaxique en dépendances, adaptation de domaine