@inproceedings{Cardon-Grabar:TALN:2019,
    author = "Cardon, Remi and Grabar, Natalia",
    title = "D\'etection automatique de phrases parall\`eles dans un corpus biom\'edical comparable",
    booktitle = "Actes de la Conf\'erence sur le Traitement Automatique des Langues Naturelles. Volume 2 : Articles courts",
    month = "7",
    year = "2019",
    address = "Toulouse, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "255-264",
    note = "Automatic detection of parallel sentences in comparable biomedical corpora",
    abstract = "Les phrases parall\`eles contiennent des informations identiques ou tr\`es proches s\'emantiquement et offrent des indications importantes sur le fonctionnement de la langue. Lorsque les phrases sont diff\'erenci\'ees par leur registre (comme expert vs. non-expert), elles peuvent \^etre exploit\'ees pour la simplification automatique de textes. Le but de la simplification automatique est d'am\'eliorer la compr\'ehension de textes. Par exemple, dans le domaine biom\'edical, la simplification peut permettre aux patients de mieux comprendre les textes relatifs \`a leur sant\'e. Il existe cependant tr\`es peu de ressources pour la simplification en fran\c{c}ais. Nous proposons donc d'exploiter des corpus comparables, diff\'erenci\'es par leur technicit\'e, pour y d\'etecter des phrases parall\`eles et les aligner. Les donn\'ees de r\'ef\'erence sont cr\'e\'ees manuellement et montrent un accord inter-annotateur de 0,76. Nous exp\'erimentons sur des donn\'ees \'equilibr\'ees et d\'es\'equilibr\'ees. La F-mesure sur les donn\'ees \'equilibr\'ees atteint jusqu'\`a 0,94. Sur les donn\'ees d\'es\'equilibr\'ees, les r\'esultats sont plus faibles (jusqu'\`a 0,92 de F-mesure) mais restent comp\'etitifs lorsque les mod\`eles sont entra{\^\i}n\'es sur les donn\'ees \'equilibr\'ees.",
    keywords = "Simplification, classification, similarit\'e, phrases parall\`eles, corpus comparables, domaine m\'edical.",
    url = "http://talnarchives.atala.org/TALN/TALN-2019/35.pdf"
}
