talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Traitement des clitiques dans un environnement multilingue

Jorge Antonio Leoni de León, Athina Michou

Résumé : Cet article décrit le traitement automatique des pronoms clitiques en espagnol et en grec moderne, deux langues de familles distinctes, dans le cadre de l’analyseur syntaxique FIPS multilingue, développé au Laboratoire d’Analyse et de Technologie de Langage (LATL). Nous abordons la distribution des pronoms clitiques, leurs similarités ainsi que leurs particularités par rapport à leur usage général. Ensuite nous présentons la méthode appliquée pour leur traitement, commune aux deux langues. Nous montrons que l’algorithme proposé peut facilement s’étendre à d’autres langues traitées par Fips qui partagent le phénomène de la cliticisation.

Abstract : In this article we present an algorithm for the computational processing of clitic pronouns in Spanish and Modern Greek by the multilingual syntactic parser Fips that has been developed at the Laboratory For Language Analysis And Technology, LATL. We provide an overview of the distribution of clitic pronouns, their similarities and particular behaviour compared to general use. Then we present a common method of processing clitics for both languages. Finally, we show that the algorithm developed can be easily extended to other languages with clitics, when treated by Fips.

Mots clés : analyseur syntaxique, clitiques, traitement multilingue

Keywords : syntactic parser, clitics, multilingual processing