Transcrire les SMS comme on reconnaît la parole
Catherine Kobus, François Yvon, Géraldine Damnati
Résumé : Cet article présente une architecture inspirée des systèmes de reconnaissance vocale pour effectuer une normalisation orthographique de messages en « langage SMS ». Nous décrivons notre système de base, ainsi que diverses évolutions de ce système, qui permettent d’améliorer sensiblement la qualité des normalisations produites.
Abstract : This paper presents a system aiming at normalizing the orthography of SMS messages, using techniques that are commonly used in automatic speech recognition devices. We describe a baseline system and various evolutions, which are shown to improve significantly the quality of the output normalizations.
Mots clés : SMS, décodage phonétique, modèles de langage, transducteurs finis
Keywords : SMS, phonetic decoding, language models, finite-state transducers