@inproceedings{Pierrejean-Tanguy:TALN:2018,
    author = "Pierrejean,B\'{e}n\'{e}dicte and Tanguy,Ludovic",
    title = "Etude de la reproductibilit\'{e} des word embeddings : rep\'{e}rage des zones stables et instables dans le lexique",
    booktitle = "Actes de la Conf\'{e}rence TALN - Volume 1 - Articles longs, articles courts de TALN",
    month = "5",
    year = "2018",
    address = "Rennes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "33-46",
    note = "Reproducibility of word embeddings : identifying stable and unstable zones in the semantic space",
    abstract = "Les mod\`{e}les vectoriels de s\'{e}mantique distributionnelle (ou word embeddings), notamment ceux produits par les m\'{e}thodes neuronales, posent des questions de reproductibilit\'{e} et donnent des repr\'{e}sentations diff\'{e}rentes \`{a} chaque utilisation, m\^{e}me sans modifier leurs param\`{e}tres. Nous pr\'{e}sentons ici un ensemble d'exp\'{e}rimentations permettant de mesurer cette instabilit\'{e}, \`{a} la fois globalement et localement. Globalement, nous avons mesur\'{e} le taux de variation du voisinage des mots sur trois corpus diff\'{e}rents, qui est estim\'{e} autour de 17\\% pour les 25 plus proches voisins d'un mot. Localement, nous avons identifi\'{e} et caract\'{e}ris\'{e} certaines zones de l'espace s\'{e}mantique qui montrent une relative stabilit\'{e}, ainsi que des cas de grande instabilit\'{e}.",
    keywords = "plongements lexicaux, \'{e}valuation, stabilit\'{e}, reproductibilit\'{e}.",
    url = "https://talnarchives.atala.org/TALN/TALN-2018/16.pdf"
}
