@inproceedings{Paroubek:COLTAL:2016,
    author = "Paroubek, Patrick",
    title = "Crit\`eres pour l'annotation active de microblogs",
    booktitle = "Actes de la conf\'erence conjointe JEP-TALN-RECITAL 2016. Volume 7 : COLTAL",
    month = "7",
    year = "2016",
    address = "Paris, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "7-16",
    note = "Criteria for active annotation of microblogs ",
    abstract = "Depuis longtemps on sait optimiser l'annotation manuelle de corpus en s\'electionnant les textes \`a annoter selon des crit\`eres rationnels plut\^ot qu'al\'eatoires, grace aux travaux issus de l'apprentissage automatique, ceci par le biais des m\'ethodes d\'evelopp\'ees par l'apprentissage actif ({\guillemotleft} active learning {\guillemotright}), un cas particulier de l'apprentissage semi-supervis\'e. Nous pr\'esentons ici une \'etude sur l'application de ces m\'ethodes, dans le cas des contenus textuels de microblogs (Twitter) en fran\c{c}ais, annot\'es dans la campagne d'\'evaluation DEFT2015 pour des t\^aches d'annotation en opinions, sentiments et \'emotions \`a granularit\'e variable. Nous comparons des crit\`eres ne supposant pas une pr\'e-annotation, comme par exemple l'entropie de Shannon, \`a des crit\`eres reposant sur la quantification des divergences oberv\'ees dans les pr\'e-annotation et \'etudions l'impact de la quantit\'e de donn\'ees annot\'ees d\'ej\`a disponibles sur la strat\'egie de s\'election, en prenant en compte la sp\'ecificit\'e des contenus issus de microblogs.",
    keywords = "apprentissage actif, annotation, microblogs, entropie de Shannon, evaluation, ROVER, Twitter.",
    url = "http://talnarchives.atala.org/ateliers/2016/COLTAL/2.pdf"
}
