talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

CasSys Un système libre de cascades de transducteurs

Denis Maurel, Nathalie Friburger

Résumé : CasSys est un système de création et de mise en oeuvre de cascades de transducteurs intégré à la plateforme Unitex. Nous présentons dans cette démonstration la nouvelle version implantée fin 2012. En particulier ont été ajoutées une interface plus conviviale et la possibilité d’itérer un même transducteur jusqu’à ce qu’il n’ait plus d’influence sur le texte. Un premier exemple concernera le traitement de texte avec une gestion complexe de balises XML et un deuxième présentera la cascade CasEN de reconnaissance des entités nommées.

Abstract : CasSys is a free toolkit integrated in the Unitex platform to create and use transducer cascades. We are presenting the new version implemented at the end of 2012. The system interface has been improved and the Kleen star operation has been added: this operation allows applying the same transducer until it no longer produces changes in the text. The first example deals with complex XML text parsing and the second with CasEN, a free cascade for French Named Entity Recognition.

Mots clés : cascade de transducteurs, graphes Unitex, texte avec balises XML, reconnaissance d'entités nommées

Keywords : transducer cascade, Unitex graphs, XML text, French Named Entity Recognition