@inproceedings{Ziane-Coavoux-Lecouteux-Schang:CORIA-TALN-2026:2026,
    author = "Ziane, Rayan and Coavoux, Maximin and Lecouteux, Benjamin and Schang, Emmanuel",
    title = {Apprentissage actif pour l'annotation morphosyntaxique du cr\'eole ha{\"\i}tien},
    booktitle = "Actes de CORIA-TALN 2026. Actes des 33\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles.  Volume 1 : articles scientifiques originaux",
    month = "6",
    year = "2026",
    address = "Nantes, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "121-133",
    note = "",
    abstract = {Cet article pr\'esente une m\'ethodologie pour l'\'etiquetage morphosyntaxique des transcriptions du corpus radiophonique Radio Ha{\"\i}ti Inter  (1300 heures) en cr\'eole ha{\"\i}tien parl\'e. Face au manque de donn\'ees annot\'ees pour l'oral, nous proc\'edons d{\textquoteright}abord \`a l{\textquoteright}adaptation d{\textquoteright}un mod\`ele multilingue (XLM-RoBERTa) par pr\'e-entra{\^\i}nement continu\'e sur le corpus cible, puis \`a un premier affinage sur les treebanks Universal Dependencies existants. Nous \'evaluons une strat\'egie d'apprentissage actif guid\'ee par une s\'election des \'echantillons d'entra{\^\i}nement selon les scores de confiance du mod\`ele (al\'eatoire, faible confiance, haute confiance) et deux strat\'egies d'affinage (s\'equentiel et joint). Les r\'esultats montrent que l'adaptation au domaine est cruciale (gains de +4,3 points), que l'approche s\'equentielle surpasse l'affinage joint, mais que la s\'election active n'apporte pas d'avantage significatif par rapport \`a un \'echantillonnage al\'eatoire. Nous mettons \`a disposition un \'echantillon annot\'e manuellement, un mod\`ele de langue adapt\'e au ha{\"\i}tien et un mod\`ele d'\'etiquetage POS pour le ha{\"\i}tien parl\'e transcrit.},
    keywords = {apprentissage actif, annotation morphosyntaxique, \'etiquetage POS, cr\'eole ha{\"\i}tien, corpus oral, adaptation au domaine, faible ressource},
    url = "27.pdf"
}
