Recherche Parcimonieuse par Raisonnement Pragmatique
Arthur Satouf, Gabriel Ben Zenou, Benjamin Piwowarski, Habiboulaye Amadou Boubacar, Pablo Piantanida
Résumé : Les méthodes actuelles de recherche d’information (RI) neuronales parcimonieuses et, dans une moindre mesure, les modèles plus traditionnels tels que BM25, ne prennent pas en compte les interactions complexes des termes de la représentation d’un même document. Dans cet article, nous montrons comment le cadre linguistique du Rational Speech Act (RSA), employé pour minimiser le nombre de caractéristiques à communiquer pour identifier un objet dans un ensemble, peut être adapté au cas de la RI – en particulier face au grand nombre de caractéristiques potentielles (ici, des tokens). Le RSA module dynamiquement les interactions token-document en tenant compte de l’influence des autres documents du corpus, permettant un meilleur contraste entre les représentations de chaque document. Nos expérimentations montrent que l’intégration du RSA améliore de manière systématique plusieurs modèles de RI et atteint d
Mots clés : Recherche d’information neuronale, Recherche parcimonieuse, Actes de langage rationnels, Raisonnement pragmatique, Pragmatique linguistique pour la recherche d’information