Using decision trees to learn lexical information in a linguistics-based NLP system
Marisa Jiménez, Martine Pettenaro
Résumé : Nous décrivons dans cet article lutilisation darbres décisionnels pour lacquisition dinformations lexicales et lenrichissement de notre système de traitement automatique des langues naturelles (NLP). Notre approche diffère dautres projets dapprentissage automatique en ce quelle repose sur lexploitation dun système danalyse linguistique profonde. Après lintroduction de notre sujet nous présentons larchitecture de notre module dapprentissage lexical. Nous présentons ensuite une situation dapprentissage lexical effectué en utilisant des arbres décisionnels; nous apprenons quels verbes prennent un sujet humain en espagnol et en français.
Abstract : This paper describes the use of decision trees to learn lexical information for the enrichment of our natural language processing (NLP) system. Our approach to lexical learning differs from other approaches in the field in that our machine learning techniques exploit a deep knowledge understanding system. After the introduction we present the overall architecture of our lexical learning module. In the following sections we present a showcase of lexical learning using decision trees: we learn verbs that take a human subject in Spanish and French.
Mots clés : Apprentissage lexical, apprentissage automatique, arbres décisionnels, dictionnaires automatiquement appris
Keywords : Lexical learning, machine learning, decision trees, learned dictionaries