talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un décodeur pour l'analyse sémantique AMR en français

Thomas Checchin, Julien Jacques, Adrien Guille

Résumé : AMR est un cadre de représentation de la sémantique des phrases sous la forme de graphes, initialement pensé pour la langue anglaise. De nombreuses techniques de traitement automatique de la langue s'appuient sur ces représentations, notamment pour compléter, corriger ou évaluer la production de grands modèles de langue. Or, il n'existe à ce jour pas d'analyseur sémantique AMR performant et librement disponible pour la langue française. C'est pourquoi, dans cet article, nous décrivons et partageons un analyseur basé sur un petit décodeur, entraîné selon une stratégie à deux temps, d'abord sur un vaste corpus AMR anglais, puis sur un corpus AMR français diversifié. L'évaluation montre les bonnes performances de cet analyseur et sa robustesse face à différents registres linguistiques. La quantification sur 8 bits, spécifiquement calibrée pour l'AMR, permet d'accroître l'efficacité de l'analyseur sans dégradation de la performance. Une version quantifiée sur 4 bits permet encore d'accroître son efficacité, au prix d'une légère baisse de la performance en analyse sémantique.

Mots clés : Analyse sémantique, AMR, décodeur