talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Approche supervisée à base de cellules LSTM bidirectionnelles pour la désambiguïsation lexicale

Loïc Vial, Benjamin Lecouteux, Didier Schwab

Résumé : En désambiguïsation lexicale, l’utilisation des réseaux de neurones est encore peu présente et très récente. Cette direction est pourtant très prometteuse, tant les résultats obtenus par ces premiers systèmes arrivent systématiquement en tête des campagnes d’évaluation, malgré une marge d’amélioration qui semble encore importante. Nous présentons dans cet article une nouvelle architecture à base de réseaux de neurones pour la désambiguïsation lexicale. Notre système est à la fois moins complexe à entraîner que les systèmes neuronaux existants et il obtient des résultats état de l’art sur la plupart des tâches d’évaluation de la désambiguïsation lexicale en anglais. L’accent est porté sur la reproductibilité de notre système et de nos résultats, par l’utilisation d’un modèle de vecteurs de mots, de corpus d’apprentissage et d’évaluation librement accessibles.

Mots clés : Désambiguïsation lexicale, Approche supervisée, LSTM, Réseau neuronal.