talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Constance et variabilité de l’incomplétude lexicale

Bruno Cartoni

Résumé : Cet article propose, au travers des résultats de différentes expériences sur la couverture des lexiques informatisés, de montrer que l’incomplétude lexicale est un phénomène constant dans tous les lexiques de TAL, mais que les mots inconnus eux-mêmes varient grandement selon les outils. Nous montrons également que la constance de cette incomplétude est étroitement liée à la créativité lexicale de la langue.

Abstract : Through various experiments on computational lexica, we show that lexical incompleteness is a regular phenomenon across NLP lexica, but that the unknown words themselves vary strongly according to the individual lexicon. We also demonstrate that the regularity of incompleteness is closely related to lexical creativity within individual language.

Mots clés : lexique informatisé, incomplétude lexicale, mots inconnus, typologie

Keywords : computational lexicon, lexical incompleteness, unknown words, typology