talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

VerNom : une base de paires morphologiques acquise sur très gros corpus

Alice Missud, Pascal Amsili, Florence Villoing

Résumé : Alors qu’une part active de la recherche en morphologie dérivationnelle s’intéresse à la compétition qui oppose les suffixations construisant des noms d’événement à partir de verbes (-age, -ment, -ion, -ure, -ance, -ade, -aison), l’accès à des données en large quantité devient nécessaire pour l’application de méthodes quantitatives. Dans l’optique de réunir des paires de verbes et de noms morphologiquement reliés dans le cadre de ces suffixations rivales, nous présentons VerNom, une base morphologique comprenant 25 857 paires verbe-nom, construite automatiquement à partir d’un corpus massif issu du web.

Mots clés : morphologie dérivationnelle, compétition morphologique, nominalisation, base lexicale.