talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Transcrire les SMS comme on reconnaît la parole

Catherine Kobus, François Yvon, Géraldine Damnati

Résumé : Cet article présente une architecture inspirée des systèmes de reconnaissance vocale pour effectuer une normalisation orthographique de messages en « langage SMS ». Nous décrivons notre système de base, ainsi que diverses évolutions de ce système, qui permettent d’améliorer sensiblement la qualité des normalisations produites.

Abstract : This paper presents a system aiming at normalizing the orthography of SMS messages, using techniques that are commonly used in automatic speech recognition devices. We describe a baseline system and various evolutions, which are shown to improve significantly the quality of the output normalizations.

Mots clés : SMS, décodage phonétique, modèles de langage, transducteurs finis

Keywords : SMS, phonetic decoding, language models, finite-state transducers