Etude des critères de désambiguïsation sémantique automatique : présentation et premiers résultats sur les cooccurrences
Laurent Audibert
Résumé : Nous présentons dans cet article les débuts d’un travail visant à rechercher et à étudier systématiquement les critères de désambiguïsation sémantique automatique. Cette étude utilise un corpus français étiqueté sémantiquement dans le cadre du projet SyntSem. Le critère ici étudié est celui des cooccurrences. Nous présentons une série de résultats sur le pouvoir désambiguïsateur des cooccurrences en fonction de leur catégorie grammaticale et de leur éloignement du mot à désambiguïser.
Abstract : This paper describes the beginning of a study which aims at researching and systematically analysing criteria for automatic word sense disambiguation. This study uses a French sense tagged corpus developed in the SyntSem project. We analyse here the cooccurrence criterion and report a series of results on the disambiguative power of cooccurrences with respect to their grammatical category and distance from the word to be disambiguated.
Mots clés : Désambiguïsation sémantique, corpus sémantiquement étiqueté, cooccurrences
Keywords : Word sense disambiguation, sense tagged corpora, cooccurrences