talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Constitution d'un corpus d'arabe tunisien parlé à Orléans

Youssra Ben Ahmed

Résumé : La constitution de corpus des parlers arabes se heurte à l’absence de ressources et le manque d’outils pour le traitement de ces derniers. Comme conséquence directe de cette situation, nous avons rencontré de maints problèmes lors de la construction d’un corpus de l’une des variétés de ces parlers, i.e. l’arabe tunisien. Nous proposons dans cet article d’exposer les principaux choix méthodologiques et techniques pour lesquels nous avons opté afin de répondre aux contraintes auxquelles nous avons été confrontée.

Mots clés : arabe tunisien, corpus oral, transcription, annotation.