@inproceedings{Strickland-Wang-Nouvel-Diot-Parvaz-Ahmad:CORIA-TALN:2025,
    author = "Strickland, Emmett and Wang, Ilaine and Nouvel, Damien and Diot-Parvaz Ahmad, B\'en\'edicte",
    title = "Syst\`emes d'\'ecriture et qualit\'e des donn\'ees : l'affinage de mod\`eles de translitt\'eration dans un contexte de faibles ressources",
    booktitle = "Actes de CORIA-TALN-RJCRI-RECITAL 2025. Actes des 32\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles (TALN),  volume 1 : articles scientifiques originaux",
    month = "6",
    year = "2025",
    address = "Marseille, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "729-740",
    note = "",
    abstract = "Cet article pr\'esente une exp\'erience visant \`a construire des mod\`eles de romanisation affin\'es pour onze langues parmi lesquelles se trouvent des langues dites peu dot\'ees. Nous d\'emontrons qu'un mod\`ele de romanisation efficace peut \^etre cr\'e\'e en affinant un mod\`ele de base entra{\^\i}n\'e sur un corpus important d'une ou plusieurs autres langues. Le syst\`eme d'\'ecriture semblerait jouer un r\^ole dans l'efficacit\'e de certains mod\`eles affin\'es. Nous pr\'esentons \'egalement des m\'ethodes pour \'evaluer la qualit\'e des donn\'ees d'entra{\^\i}nement et d'\'evaluation, et comparons notre mod\`ele arabe le plus performant \`a un mod\`ele de r\'ef\'erence.",
    keywords = "Translitt\'eration automatique, langues peu dot\'ees, affinage.",
    url = "https://talnarchives.atala.org/TALN/TALN-2025/104.pdf"
}
