talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Using decision trees to learn lexical information in a linguistics-based NLP system

Marisa Jiménez, Martine Pettenaro

Résumé : Nous décrivons dans cet article l’utilisation d’arbres décisionnels pour l’acquisition d’informations lexicales et l’enrichissement de notre système de traitement automatique des langues naturelles (NLP). Notre approche diffère d’autres projets d’apprentissage automatique en ce qu’elle repose sur l’exploitation d’un système d’analyse linguistique profonde. Après l’introduction de notre sujet nous présentons l’architecture de notre module d’apprentissage lexical. Nous présentons ensuite une situation d’apprentissage lexical effectué en utilisant des arbres décisionnels; nous apprenons quels verbes prennent un sujet humain en espagnol et en français.

Abstract : This paper describes the use of decision trees to learn lexical information for the enrichment of our natural language processing (NLP) system. Our approach to lexical learning differs from other approaches in the field in that our machine learning techniques exploit a deep knowledge understanding system. After the introduction we present the overall architecture of our lexical learning module. In the following sections we present a showcase of lexical learning using decision trees: we learn verbs that take a human subject in Spanish and French.

Mots clés : Apprentissage lexical, apprentissage automatique, arbres décisionnels, dictionnaires automatiquement appris

Keywords : Lexical learning, machine learning, decision trees, learned dictionaries