talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Semi-automated Extraction of a Wide-Coverage Type-Logical Grammar for French

Richard Moot

Résumé : Cet article décrit le développement d’une grammaire catégorielle à large couverture du Français, extraite à partir du corpus arboré de Paris 7 et vérifiée et corrigée manuellement. Le grammaire catégorielle résultant est évaluée en utilisant un supertagger et obtient des résultats comparables aux meilleurs supertaggers pour l’Anglais.

Abstract : The paper describes the development of a wide-coverage type-logical grammar for French, which has been extracted from the Paris 7 treebank and received a significant amount of manual verification and cleanup. The resulting treebank is evaluated using a supertagger and performs at a level comparable to the best supertagging results for English.

Mots clés : Extraction de grammaires, grammaires catégorielles, supertagging

Keywords : Categorial grammar, grammar extraction, supertagging, type-logical grammar