talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Améliorer l’extraction et la description d’expressions polylexicales grâce aux règles transformationnelles

Aurélie Joseph

Résumé : Cet article présente une méthodologie permettant d’extraire et de décrire des locutions verbales vis-à-vis de leur comportement transformationnel. Plusieurs objectifs sont ciblés : 1) extraire automatiquement les expressions phraséologiques et en particulier les expressions figées, 2) décrire linguistiquement le comportement des phraséologismes 3) comparer les méthodes statistiques et notre approche et enfin 4) montrer l’importance de ces expressions dans un outil de classification de textes.

Abstract : This paper presents a methodology to extract and describe verbal multiword expressions using their transformational behavior. Several objectives are targeted: 1) automatically extracting MWE and especially frozen expression, 2) describing linguistically their MWE behavior, 3) comparing statistical methods and our approach, and finally 4) showing the importance of MWE in a text classification tool.

Mots clés : expressions polylexicales, expressions figées, locution verbale, extraction, transformation, classification de textes

Keywords : multiword expression, verbal phrase, extraction, transformation, text classification