talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Extraction d'informations pour la veille technologique

Bénédicte Goujon

Résumé : Cet article présente la démarche suivie pour mettre en place un logiciel d’aide à la veille technologique. Pour l’analyse de documents très techniques, les veilleurs utilisent des outils d’infométrie, qui sont pertinents sur les données structurées, mais qui ne sont pas adaptés pour l’exploitation des informations textuelles. Nous avons donc réalisé un logiciel d’extraction d’informations, nommé VIGITEXT. Notre approche, basée sur la définition de notions indépendantes du domaine comme l’/amélioration/, l’/augmentation/ ou l’/utilisation/, permet d’extraire des informations textuelles à partir d’abrégés descriptifs de brevets rédigés en anglais sans utiliser de lexique technique ou de calculs statistiques. De plus, cette méthode est opérationnelle pour tous les sujets de veille, et les résultats, qui sont les extraits organisés selon les notions, sont simples à utiliser par des veilleurs. Dans cet article, nous décrivons les particularités de la veille technologique, et les limites des logiciels généralement utilisés. Ensuite, nous détaillons l’exploitation de notions générales basée sur la définition de connaissances linguistiques et qui met en oeuvre la méthode d’exploration contextuelle. Nous présentons enfin le prototype VIGITEXT, avec ses spécificités et ses utilisations possibles dans une démarche de veille.