talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Détection des ellipses dans des corpus de sous-titres en anglais

Anissa Hamza, Delphine Bernhard

Résumé : Cet article présente une méthodologie de détection des ellipses en anglais qui repose sur des patrons combinant des informations sur les tokens, leur étiquette morphosyntaxique et leur lemme. Les patrons sont évalués sur deux corpus de sous-titres. Ces travaux constituent une étape préalable à une étude contrastive et multi-genres de l’ellipse.

Mots clés : ellipse, anglais, corpus, sous-titres, détection automatique.