talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Unsupervised approaches to metonymy recognition

Yves Peirsman

Résumé : Jusqu’à présent, la question de la reconnaissance automatique de métonymies a souvent été abordée avec des approches supervisées. Toutefois, ces approches nécessitent l’annotation d’un nombre important d’occurrences d’apprentissage et, dès lors, elles empêchent le développement d’un système de reconnaissance de métonymies à grande échelle. Cet article étudie la possibilité de résoudre ce problème du goulot d’étranglement de l’acquisition des connaissances en recourant à des techniques d’apprentissages non supervisées. Bien que la technique en question, l’algorithme de Schütze (1998), soit souvent appliquée en désambiguïsation sémantique, je montrerai qu’elle s’avère trop peu solide pour le cas spécifique de la reconnaissance de métonymies. À cet effet, je propose d’étudier l’influence de quatre variables sur les performances de la technique non supervisée, à savoir le type de données, la taille de la fenêtre d’observation, l’application de la décomposition en valeurs singulières (SVD) et le type de sélection de propriétés.

Abstract : To this day, the automatic recognition of metonymies has generally been addressed with supervised approaches. However, these require the annotation of a large number of training instances and hence, hinder the development of a wide-scale metonymy recognition system. This paper investigates if this knowledge acquisition bottleneck in metonymy recognition can be resolved by the application of unsupervised learning. Although the investigated technique, Schütze’s (1998) algorithm, enjoys considerable popularity in Word Sense Disambiguation, I will show that it is not yet robust enough to tackle the specific case of metonymy recognition. In particular, I will study the influence on its performance of four variables—the type of data set, the size of the context window, the application of SVD and the type of feature selection.

Mots clés : reconnaissance de métonymies, désambiguïsation sémantique, apprentissage par machine non supervisé

Keywords : metonymy recognition, word sense disambiguation, unsupervised machine learning