talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Conception d'un système de détection d'intention pour un moteur de recherche sur Internet

Estelle Maudet, Christophe Servan

Résumé : Dans les moteurs de recherche sur Internet, l’une des tâches les plus importantes vise à identifier l’intention de l’utilisateur. Cet article présente notre étude pour proposer un nouveau système de détection d’intention pour le moteur de recherche sur Internet Qwant. Des logs de clic au système de détection d’intention, l’ensemble du processus est expliqué, y compris les contraintes industrielles qui ont dû être prises en compte. Une analyse manuelle des données groupées a d’abord été appliquée sur les journaux afin de mieux comprendre les objectifs de l’utilisateur et de choisir les catégories d’intention pertinentes. Lorsque la recherche satisfait aux contraintes industrielles, il faut faire des choix architecturaux et faire des concessions. Cet article explique les contraintes et les résultats obtenus pour ce nouveau système en ligne.

Mots clés : Détection d’intention, Classification, humain-dans-la-boucle, extraction d’informa- tion, Recherche industrielle.