talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

SibyMot : Modélisation stochastique du langage intégrant la notion de chunks

Igor Schadle, Jean-Yves Antoine, Brigitte Le Pévédic, Franck Poirier

Résumé : Cet article présente le modèle de langage développé pour le système Sibylle, un système d’aide à la communication pour les personnes handicapées. L’utilisation d’un modèle de langage permet d’améliorer la pertinence des mots proposés en tenant compte du contexte gauche de la saisie en cours. L’originalité de notre modèle se situe dans l’intégration de la notion de chunks afin d’élargir la taille du contexte pris en compte pour l’estimation de la probabilité d’apparition des mots.

Abstract : We present in this article the language model of Sibyl, a new Alternative and Augmentative Communication (AAC) system. The use of language modeling improves the relevance of displayed words by taking into account the left context of the current sentence. The originality of our model is to introduce chunking. This enlarges the context taken into account to estimate the words probability.

Mots clés : Aide à la communication, modélisation stochastique du langage, n-gramme, chunks

Keywords : AAC, stochastic language modeling, n-gram, chunks