talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

STAM : traduction des textes non structurés (dialectes du Maghreb)

Mehdi Embarek, Soumya Embarek

Résumé : L’utilisation des plateformes de communication (réseaux sociaux, forums de discussions, ...) a pris une ampleur considérable. Ces plateformes permettent aux internautes d’exprimer leur avis concernant un sujet, demander ou échanger des informations, commenter un événement, etc. Ainsi, nous retrouvons dans ces différentes sources d’informations une quantité importante de textes rédigés dans des dialectes locaux dont sont originaires les rédacteurs. Cependant, ces textes non structurés rendent l’exploitation des outils de traitement automatique des langues très difficile. Le système STAM aborde cette problématique en proposant un système capable de transcrire automatiquement des textes écrits dans un dialecte parlé dans les pays du Maghreb en un texte facilement interprétable et compréhensible (français ou anglais).

Mots clés : Dialecte, Arabe, Maghreb, Multi-dialectes, Transcription, STAM.