talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

SVETLAN' ou Comment Classer les Mots en fonction de leur Contexte

Gaël De Chalendar, Brigitte Grau

Résumé : L’utilisation de connaissances sémantiques dans les applications de TAL améliore leurs performances. Cependant, bien que des lexiques étendus aient été développés, il y a peu de ressources non dédiées à des domaines spécialisés et contenant des informations sémantiques pour les mots. Dans le but de construire une telle base, nous avons conçu le système SVETLAN’, capable d’apprendre des catégories de noms à partir de textes, quel que soit leur domaine. Dans le but d’éviter de créer des classes générales regroupant tous les sens des mots, les classes sont apprises en fonction de l’usage des mots en contexte.

Mots clés : sémantique, langue, langue générale, segment textuel, module d'apprentissage