@inproceedings{Claveau-Chaffin-Kijak:TALN:2021,
    author = "Claveau, Vincent and Chaffin, Antoine and Kijak, Ewa",
    title = "La g\'en\'eration de textes artificiels en substitution ou en compl\'ement de donn\'ees d'apprentissage",
    booktitle = "Actes de la 28e Conf\'erence sur le Traitement Automatique des Langues Naturelles. Volume 1 : Articles longs",
    month = "6",
    year = "2021",
    address = "Lille, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "36-48",
    note = "Generating artificial texts as substitution or complement of training data ",
    abstract = "La qualit\'e des textes g\'en\'er\'es artificiellement s'est consid\'erablement am\'elior\'ee avec l'apparition des transformers. La question d'utiliser ces mod\`eles pour augmenter les donn\'ees d'apprentissage pour des t\^aches d'apprentissage supervis\'e se pose naturellement. Dans cet article, cette question est explor\'ee sous 3 aspects : (i) les donn\'ees artificielles sont-elles un compl\'ement efficace ? (ii) peuvent-elles remplacer les donn\'ees d'origines quand ces derni\`eres ne peuvent pas \^etre distribu\'ees, par exemple pour des raisons de confidentialit\'e ? (iii) peuvent-elles am\'eliorer l'explicabilit\'e des classifieurs ? Diff\'erentes exp\'eriences sont men\'ees sur une t\^ache de classification en utilisant des donn\'ees g\'en\'er\'ees artificiellement en adaptant des mod\`eles GPT-2. Les r\'esultats montrent que les donn\'ees artificielles ne sont pas encore suffisamment bonnes et n\'ecessitent un pr\'e-traitement pour am\'eliorer significativement les performances. Nous montrons que les approches sac-de-mots b\'en\'eficient le plus de telles augmentations de donn\'ees.",
    keywords = "G\'en\'eration de textes, augmentation de donn\'ees, classification.",
    url = "http://talnarchives.atala.org/TALN/TALN-2021/41.pdf"
}
