talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Etude des critères de désambiguïsation sémantique automatique : présentation et premiers résultats sur les cooccurrences

Laurent Audibert

Résumé : Nous présentons dans cet article les débuts d’un travail visant à rechercher et à étudier systématiquement les critères de désambiguïsation sémantique automatique. Cette étude utilise un corpus français étiqueté sémantiquement dans le cadre du projet SyntSem. Le critère ici étudié est celui des cooccurrences. Nous présentons une série de résultats sur le pouvoir désambiguïsateur des cooccurrences en fonction de leur catégorie grammaticale et de leur éloignement du mot à désambiguïser.

Abstract : This paper describes the beginning of a study which aims at researching and systematically analysing criteria for automatic word sense disambiguation. This study uses a French sense tagged corpus developed in the SyntSem project. We analyse here the cooccurrence criterion and report a series of results on the disambiguative power of cooccurrences with respect to their grammatical category and distance from the word to be disambiguated.

Mots clés : Désambiguïsation sémantique, corpus sémantiquement étiqueté, cooccurrences

Keywords : Word sense disambiguation, sense tagged corpora, cooccurrences