La reconnaissance automatique des relations de cohérence RST en français.
Martial Pastor, Erik Bran Marino, Nelleke Oostdijk
Résumé : Les parseurs de discours ont suscité un intérêt considérable dans les récentes applications de traitement automatique du langage naturel. Cette approche dépasse les limites traditionnelles de la phrase et peut s’étendre pour englober l’identification de relation de discours. Il existe plusieurs parseurs spécialisés dans le traitement autmatique du discours, mais ces derniers ont été principalement évalués sur des corpus anglais. Par conséquent, il n’est pas évident de bien cerner les éléments linguistiques importants sur lesquels les parseurs se basent pour classifier les relations de discours en dehors de l’anglais. Cet article évalue les performances du parseur DMRST sur le corpus RST-DT traduit en français. Nous constatons que les performances de classification des relations de discours en français sont comparables à celles obtenues pour d'autres langues. En analysant les succès et échecs de la classification des relations, nous soulignons l'impact des marqueurs de discours et des structures syntaxiques sur la précision du parseur.
Mots clés : parseurs de discours,théorie de la structure rhétorique,relations de discours,traitement automatique du discours,marqueurs de discsours,structures syntaxiques