@inproceedings{Eshkol-Taravella-Maarouf-Skrovec-Badin:TALN:2019,
    author = "Eshkol-Taravella, Iris and Maarouf, Mariame and Skrovec, Marie and Badin, Flora",
    title = "Chunker diff\'erents types de discours oraux :  d\'efis pour l'apprentissage automatique",
    booktitle = "Actes de la Conf\'erence sur le Traitement Automatique des Langues Naturelles. Volume 2 : Articles courts",
    month = "7",
    year = "2019",
    address = "Toulouse, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "195-204",
    note = "Chunking different spoken speech types : challenges for machine learning",
    abstract = "Le travail d\'ecrit le d\'eveloppement d'un chunker pour l'oral par apprentissage supervis\'e avec les CRFs, \`a partir d'un corpus de r\'ef\'erence de petite taille et compos\'e de productions de nature diff\'erente : monologue pr\'epar\'e vs discussion spontan\'ee. La m\'ethodologie respecte les sp\'ecificit\'es des donn\'ees trait\'ees. L'apprentissage tient compte des r\'esultats propos\'es par diff\'erents \'etiqueteurs morpho-syntaxiques disponibles sans correction manuelle de leurs r\'esultats. Les exp\'eriences montrent que le genre de discours (monologue vs discussion), la nature de discours (spontan\'e vs pr\'epar\'e) et la taille du corpus peuvent influencer les r\'esultats de l'apprentissage, ce qui confirme que la nature des donn\'ees trait\'ees est \`a prendre en consid\'eration dans l'interpr\'etation des r\'esultats.",
    keywords = "chunking, apprentissage supervis\'e, CRF, segmentation automatique de l'oral, corpus oral, variation discursive, genre",
    url = "http://talnarchives.atala.org/TALN/TALN-2019/4.pdf"
}