La traduction automatique dialectale: état de l'art et étude préliminaire sur le continuum dialectal de l'occitan
Oriane Nédey
Résumé : Cet article dresse un état de l'art de la traduction automatique et de son évaluation pour les langues à variation dialectale, et en particulier pour les continuums dialectaux. Pour illustrer cet état de l'art, nous proposons une série d'expériences préliminaires sur le continuum occitan, afin de dresser un état des performances des systèmes existants pour la traduction depuis et vers plusieurs variétés d'occitan. Nos résultats indiquent d'une part des performances globalement satisfaisantes pour la traduction vers le français et l'anglais. D'autre part, des analyses mélangées à des outils d'identification de langues sur les prédictions vers l'occitan mettent en lumière la capacité de la plupart des systèmes évalués à générer des textes dans cette langue (y compris en zero-shot ), mais révèlent aussi des limitations en termes d'évaluation de la diversité dialectale dans les traductions proposées.
Mots clés : traduction automatique, occitan, évaluation, langues peu dotées, dialectes.