talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Une méthode discriminant formation simple pour la traduction automatique avec Grands Caractéristiques

Tian Xia, Shaodan Zhai, Zhongliang Li, Shaojun Wang

Résumé : Marge infusé algorithmes détendus (MIRAS) dominent modèle de tuning dans la traduction automatique statistique dans le cas des grandes caractéristiques de l'échelle, mais ils sont également célèbres pour la complexité de mise en œuvre. Nous introduisons une nouvelle méthode, qui concerne une liste des N meilleures comme une permutation et minimise la perte Plackett-Luce de permutations rez-de-vérité. Des expériences avec des caractéristiques à grande échelle démontrent que, la nouvelle méthode est plus robuste que MERT ; si ce est seulement à rattacher avec Miras, il a un avantage comparativement, plus facile à mettre en œuvre.

Abstract : The margin infused relaxed algorithm (MIRAs) dominates model tuning in statistical machine translation in the case of large scale features, but also they are famous for the complexity in implementation. We introduce a new method, which regards an N-best list as a permutation and minimizes the Plackett-Luce loss of ground-truth permutations. Experiments with large-scale features demonstrate that, the new method is more robust than MERT ; though it is only matchable with MIRAs, it has a comparatively advantage, easier to implement.

Mots clés : Traduction automatique, ajustement du modèle, caractéristiques à grande échelle

Keywords : machine translation, model tuning, large-scale features