talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Construction de patrons lexico-syntaxiques d'extraction pour l'acquisition de connaissances à partir du web

Chloé Monnin, Olivier Hamon

Résumé : Cet article présente une méthode permettant de collecter sur le web des informations complémentaires à une information prédéfinie, afin de remplir une base de connaissances. Notre méthode utilise des patrons lexico-syntaxiques, servant à la fois de requêtes de recherche et de patrons d’extraction permettant l’analyse de documents non structurés. Pour ce faire, il nous a fallu définir au préalable les critères pertinents issus des analyses dans l’objectif de faciliter la découverte de nouvelles valeurs.

Mots clés : Construction de patrons, extraction d’information, extraction d’entités nommées, syntaxe en dépendances, apprentissage de patrons d’extraction, web comme corpus.