talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Akenou-Breizh, un projet de plate-forme valorisant des ressources et outils informatiques et linguistiques pour le breton

Annie Foret, Valérie Bellynck, Christian Boitet

Résumé : Nous présentons un nouveau projet, Akenou-Breizh, qui vise (1) à mettre en place une plate-forme permettant d’étudier les influences d’une langue d’héritage, comme le breton, sur une langue d’usage, comme le français, et (2) à mettre à disposition de tous les intéressés des outils s’intégrant au “Web sémantique et multilingue”, et proposant des accès proactifs aux connaissances sur le breton ainsi qu’une visualisation directe des correspondances sous-phrastiques dans des présentations bilingues alignées. Nous nous proposons non seulement d’utiliser les nombreuses ressources disponibles librement, en particulier celles de l’OPLB 1 et du projet APERTIUM, mais aussi d’en créer de nouvelles, comme des corpus bilingues alignés de bonne qualité, en utilisant le “Web collaboratif”, et de construire sur le site dédié lingwarium.org des modules linguistiques améliorant ou étendant ceux qui existent, par exemple un analyseur-générateur morphologique. Nous décrivons aussi une expérience réalisée à partir d’un lexique réduit pour le breton, qui montre comment on peut enrichir un dictionnaire classique, en le reliant à un treillis de thèmes et à un système de gestion de contexte (ici CAMELIS), de façon à ce qu’on puisse l’interroger (par facettes sémantiques) et comparer différentes ressources.

Abstract : We present a new project, Akenou-Breizh, that aims to (1) put in place a platform allowing to study the influences of an heritage language, such as Breton, on a usage language, such as French, and (2) to make available, to all interested persons, tools well integrated in the “semantic and multilingual web” and proposing proactive access to various kinds of knowledge concerning Breton, as well as direct visualisation of infrasentential correspondences in aligned bilingual presentations. We plan not only to use the numerous freely available resources, in particular those of OPLB and of the APERTIUM project, but also to create new ones, such as good quality bilingual aligned corpora, thereby using the “collaborative web”, and to build on the dedicated lingwarium.org web site linguistic modules improving on or extending those that exist, for example a morphological analyzer-generator.We also describe an experiment set up starting from a reduced lexicon for Breton, that shows how it is possible to enrich a classical dictionary, by linking it to a lattice of topics and to a context management system (here CAMELIS), in such a way one can query it (along semantic facets) and compare different resources.

Mots clés : breton, langue d’héritage, langue d’usage, outils et ressources, études contrastives

Keywords : Breton, heritage language, usage language, tools and resources, contrastive studies