talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Recherche et visualisation de mots sémantiquement liés

Alexander Panchenko, Hubert Naets, Laetitia Brouwers, Pavel Romanov, Cédrick Fairon

Résumé : Nous présentons PatternSim, une nouvelle mesure de similarité sémantique qui repose d’une part sur des patrons lexico-syntaxiques appliqués à de très vastes corpus et d’autre part sur une formule de réordonnancement des candidats extraits. Le système, initialement développé pour l’anglais, a été adapté au français. Nous rendons compte de cette adaptation, nous en proposons une évaluation et décrivons l’usage de ce nouveau modèle dans la plateforme de consultation en ligne Serelex.

Abstract : We present PatternSim, a new semantic similarity measure that relies on morpho-syntactic patterns applied to very large corpora and on a re-ranking formula that reorder extracted candidates. The system, originally developed for English, was adapted to French. We explain this adaptation, propose a first evaluation of it and we describe how this new model was used to build the Serelex online search platform.

Mots clés : Mesure de similarité sémantique, relations sémantiques

Keywords : Semantic similarity measure, semantic relations