talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Interprétation rapide et non visuelle de pagesWeb : TAL et Tonnerre de mots

Jean-Marc Lecarpentier, Fabrice Maurel, Stéphane Ferrari, Alexandre Beudin

Résumé : L’accès rapide à un contenu précis dans une page web est généralement réalisé par une étape dite d’écrémage (ou skimming) pour avoir une vue globale, suivi d’une stratégie de balayage (ou scanning) pour repérer les informations voulues. Ces deux étapes naturelles pour une navigation visuelle n’existent pas dans la cas d’un accès non visuel à la page donnée. Nous présentons dans cet article le travail en cours sur le concept de tonnerre de mots (ou tag thunder), traduction à l’oral du concept de nuage de mots. Après avoir segmenté une page web en blocs, les mots-clés significatifs sont extraits de chaque bloc et pondérés afin d’obtenir un nuage de mots. Parmi ces mots, les mots-clés navigants permettent à l’utilisateur de naviguer en profondeur dans les divers blocs de la page. L’ensemble est transformé en tonnerre de mots par vocalisation. La présentation de ce travail en cours permet aussi de présenter les diverses pistes de recherche envisagées.

Abstract : Skimming and scanning are two different strategies for speed reading and are used when accessing web pages. Skimming is used when we discover a page and it allows a reader to get a first glance of its content. Scanning usually follows, in order to get a more precise idea of the content or to find a specific content. However, these techniques are not available in non visual situations. This article introduces the concept of tag thunder, which aims to provide speed reading techniques similar to skimming and scanning to visually impaired people. A tag thunder is the oral transposition of a tag cloud, where keywords are presented with typographic effects depending on the word’s importance.Within a tag thunder, each keyword is pronounced differently to enable the user to perceive its importance. Navigation keywords enable the user to select a corresponding block. This work in progress is based on three steps. First the web page is segmented to extract its main blocks. Then, for each block, keywords are extracted to create tag clouds. Finally, tag clouds are converted to tag thunders and presented to the user. Our solution is implemented within a Firefox extension and opens several research tracks.

Mots clés : accessibilité, oral, tag thunder, nuage de mots, extraction, segmentation.

Keywords : accessibility, tag thunder, tag cloud, extraction, segmentation.