@inproceedings{Royan-Lange-Abidi:DEFT:2020,
    author = "Royan, Clothilde and Lang\'e, Jean-Marc and Abidi, Zied",
    title = "Extraction d'information de sp\'ecialit\'e avec un syst\`eme commercial g\'en\'erique",
    booktitle = "Actes de l'atelier D\'efi Fouille de Textes@JEP-TALN 2020  similarit\'e s\'emantique et extraction d'information fine. Atelier D\'Efi Fouille de Textes",
    month = "6",
    year = "2020",
    address = "Nancy, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "79-90",
    note = "Extracting Medical Information with an Off-the-shelf Software Product",
    abstract = "Nous avons particip\'e \`a la t\^ache 3 du D\'efi Fouille de texte 2020, d\'edi\'ee \`a l'extraction d'information de sp\'ecialit\'e, dans le but de tester notre produit commercial d'extraction d'information, Watson Knowledge Studio (WKS), face \`a des \'equipes acad\'emiques et industrielles. Outre la quantit\'e r\'eduite de donn\'ees d'apprentissage, la nature des annotations des corpus de r\'ef\'erence posait des probl\`emes d'adaptation \`a notre produit. Aussi avons-nous d\^u modifier le sch\'ema d'annotation du corpus d'apprentissage, ex\'ecuter l'apprentissage, puis appliquer des r\`egles aux r\'esultats obtenus afin d'obtenir des annotations conformes au sch\'ema initial. Nous avons \'egalement appliqu\'e des dictionnaires de sp\'ecialit\'e (anatomie, pathologie, etc.) pour injecter de la connaissance du domaine et renforcer les mod\`eles d'apprentissage automatique. Au final, nos r\'esultats lors de la phase de test se situent dans la moyenne de l'ensemble des \'equipes, avec des F-mesures de 0,43 pour la sous-t\^ache 1 et 0,63 pour la sous-t\^ache 2.",
    keywords = "extraction d'information, donn\'ees cliniques, Watson Knowledge  Studio",
    url = "http://talnarchives.atala.org/ateliers/2020/DEFT/213.pdf"
}