Stéganographie textuelle par paraphrase : une approche par LLM

Geoffrey Anquetil, Jonathan Chevelu

Résumé : La stéganographie textuelle par paraphrase permet de dissimuler un message secret tout en garantissant l’ancrage contextuel et la pertinence du texte généré vis-à-vis d’une source. Cet article formalise ce problème d’optimisation et établit un protocole d’évaluation robuste s’appuyant sur des métriques récentes . Sur le plan technique, nous proposons une méthode exploratoire exploitant un grand modèle de langue (LLM) guidé par une recherche en faisceau diversifiée (DBS) sous contrainte de parité de bloc. Afin d’isoler l’impact de l’insertion stéganographique, les textes produits sont systématiquement comparés à des paraphrases générées par le même modèle sans contrainte. Si l’approche confirme la faisabilité de l’insertion et atteint une capacité compétitive, des écarts significatifs sont observés concernant la perplexité et la fidélité sémantique fine. Ces différences illustrent les altérations induites par la génération sous contrainte stricte et ouvrent de nouvelles perspectives de recherche pour cette tâche.

Mots clés : stéganographie textuelle, paraphrase, grand modèle de langue

Téléchargement :
[article]
[bibtex]

talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Stéganographie textuelle par paraphrase : une approche par LLM

Geoffrey Anquetil, Jonathan Chevelu