talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Productivité quantitative des suffixations par -ité et -Able dans un corpus journalistique moderne

Natalia Grabar, Delphine Tribout, Georgette Dal, Bernard Fradin, Nabil Hathout, Stéphanie Lignon, Fiammetta Namer, Clément Plancq, François Yvon, Pierre Zweigenbaum

Résumé : Dans ce travail, nous étudions en corpus la productivité quantitative des suffixations par -Able et par -ité du français, d’abord indépendamment l’une de l’autre, puis lorsqu’elles s’enchaînent dérivationnellement (la suffixation en -ité s’applique à des bases en -Able dans environ 15 % des cas). Nous estimons la productivité de ces suffixations au moyen de mesures statistiques dont nous suivons l’évolution par rapport à la taille du corpus. Ces deux suffixations sont productives en français moderne : elles forment de nouveaux lexèmes tout au long des corpus étudiés sans qu’on n’observe de saturation, leurs indices de productivité montrent une évolution stable bien qu’étant dépendante des calculs qui leur sont appliqués. On note cependant que, de façon générale, de ces deux suffixations, c’est la suffixation par -ité qui est la plus fréquente en corpus journalistique, sauf précisément quand -ité s’applique à un adjectif en -Able. Étant entendu qu’un adjectif en -Able et le nom en -ité correspondant expriment la même propriété, ce résultat indique que la complexité de la base est un paramètre à prendre en considération dans la formation du lexique possible.

Abstract : In this paper, we study the quantitative productivity of French suffixes -Able and -ité in corpora. We first analyze them independently and then when they belong to the same derivational chain (the suffix -ité chooses bases with -Able in about 15 % of its formations). The productivity of these suffixations is statisticallly estimated in relation to the corpus size. Both these affixes are productive in modern French : they continue to form new lexemes throughout the corpora and are not saturated, their productivity indexes show a stable evolution although this is dependent on applied calculations. Nevertheless, -ité is more frequent in the journalistic corpora except when it is applied to adjectives suffixed with -Able. Knowing that both -Able adjective and its -ité noun convey the same property, this finding indicates that the base complexity has to be taken into account in the formation of possible lexicon.

Mots clés : morphologie, corpus journalistique, -Able, -ité, productivité morphologique quantitative

Keywords : morphology, newspaper corpus, -Able, -ité, quantitative morphological productivity