talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Démo de AMALD-serveur et AMALD-corpus, dédiés à l’analyse morphologique de l’allemand

Christian Boitet, Vincent Berment, Jean-Philippe Guilbaud, Claire Lemaire

Résumé : Le projet AMALDarium vise à offrir sur la plateforme lingwarium.org (1) un service d’analyse morphologique de l’allemand (AMALD-serveur), à grande couverture et de haute qualité, traitant la flexion, la dérivation et la composition, ainsi que les verbes à particule séparable séparée (ou agglutinée), (2) un corpus de référence de haute qualité donnant tous les résultats possibles de l’analyse morphologique, avant filtrage par une méthode statistique ou syntaxique, et (3) une plateforme (AMALD-éval) permettant d’organiser des évaluations comparatives, dans la perspective d’améliorer les performances d’algorithmes d’apprentissage en morphologie. Nous présentons ici une démonstration en ligne seulement de AMALD-serveur et AMALD-corpus. Le corpus est un sous-ensemble anonymisé et vérifié d’un corpus en allemand formé de textes sur le cancer du sein, contenant de nombreux mots composés techniques.

Mots clés : Allemand, analyse morphologique, corpus de référence, services web gratuits.