talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Annotation d’expressions polylexicales verbales en arabe : validation d’une procédure d’annotation multilingue

Najet Hadj Mohamed, Cherifa Ben Khelil, Agata Savary, Iskander Keskes, Jean Yves Antoine, Lamia Hadrich Belguith

Résumé : Cet article décrit nos efforts pour étendre le projet PARSEME à l’arabe standard moderne. L’applicabilité du guide d’annotation de PARSEME a été testée en mesurant l’accord inter-annotateurs dès la première phase d’annotation. Un sous-ensemble de 1062 phrases du Prague Arabic Dependency Treebank (PADT) a été sélectionné et annoté indépendamment par deux locutrices natives arabes. Suite à leurs annotations, un nouveau corpus arabe avec plus de 1250 expressions polylexicales verbales (EPV) annotées a été construit.

Mots clés : Expressions polylexicales arabes, PARSEME, guide d’annotation .