talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un étiqueteur sémantique des énoncés en langue arabe

Anis Zouaghi, Mounir Zrigui, Mohamed Ben Ahmed

Résumé : Notre article s’intègre dans le cadre du projet intitulé Oréodule: un système de reconnaissance, de traduction et de synthèse de la parole spontanée. L’objectif de cet article est de présenter un modèle d’étiquetage probabiliste, selon une approche componentielle et sélective. Cette approche ne considère que les éléments de l’énoncé porteurs de sens. La signification de chaque mot est représentée par un ensemble de traits sémantiques Ts. Ce modèle participe au choix des Ts candidats lors du décodage sémantique d’un énoncé.

Abstract : The work reported here is part of a larger research project, Oréodule, aiming at developing tools for automatic speech recognition, translation, and synthesis for the Arabic language. This article focuses on a probabilistic labelling model, according to a componential and selective approach. This approach considers only the elements of the statement carrying direction. The significance of each word is represented by a whole of semantic features Ts. This model takes part in the choice of the Ts candidates at the time of the semantic decoding of a statement.

Mots clés : Modèles statistiques de langage, Modèles n-classes, Décodage sémantique, Approche componentielle et sélective

Keywords : Statistical models of language, Models N-classes, Semantic analyze, Componential and selective approach