@inproceedings{Belfathi-Hernandez-Monceaux-Dufour:CORIA-TALN:2025,
    author = "Belfathi, Anas and Hernandez, Nicolas and Monceaux, Laura and Dufour, Richard",
    title = "Le r\^ole du contexte dans la classification s\'equentielle de phrases pour les documents longs",
    booktitle = "Actes de CORIA-TALN-RJCRI-RECITAL 2025. Actes des 32\`eme Conf\'erence sur le Traitement Automatique des Langues Naturelles (TALN),  volume 1 : articles scientifiques originaux",
    month = "6",
    year = "2025",
    address = "Marseille, France",
    publisher = "Association pour le Traitement Automatique des Langues",
    pages = "488-501",
    note = "",
    abstract = "La classification s\'equentielle de phrases \'etend la classification traditionnelle en int\'egrant un contexte plus large. Cependant, les approches de pointe rencontrent deux d\'efis majeurs dans le traitement automatique des documents longs : les mod\`eles de langue pr\'eentra{\^\i}n\'es sont limit\'es par des contraintes de longueur d'entr\'ee, tandis que les mod\`eles hi\'erarchiques propos\'es introduisent souvent du contenu non pertinent. Nous proposons une approche de recherche d'information au niveau du document visant \`a extraire uniquement le contexte le plus pertinent. Nous introduisons deux types d'heuristiques : S\'equentiel , qui capture l'information locale, et S\'electif, qui s\'electionne les phrases les plus s\'emantiquement similaires. Nos exp\'eriences sur trois corpus juridiques en anglais montrent que ces heuristiques am\'eliorent les performances. Les heuristiques s\'equentielles surpassent les mod\`eles hi\'erarchiques sur deux des trois jeux de donn\'ees. d\'emontrant l'apport du contexte cibl\'e.",
    keywords = "Extraction d'information, classification s\'equentielle de phrases, documents longs, mod\`eles de langue pr\'eentra{\^\i}n\'es.",
    url = "https://talnarchives.atala.org/TALN/TALN-2025/8.pdf"
}
