talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Combinaison d'approches pour l'extraction automatique d'événements

Laurie Serrano, Thierry Charnois, Stephan Brunessau, Bruno Grilheres, Maroua Bouzid

Résumé : Dans cet article, nous présentons un système d’extraction automatique d’événements fondé sur deux approches actuelles en extraction d’information : la première s’appuie sur des règles linguistiques construites manuellement et la seconde se fonde sur un apprentissage automatique de patrons linguistiques. Les expérimentations réalisées montrent que combiner ces deux méthodes d’extraction permet d’améliorer significativement la qualité des événements extraits (amélioration de près de 10 points de F-mesure).

Abstract : In this paper, we present an automatic system for extracting events based on the combination of two existing information extraction approaches : the first one is made of hand-crafted linguistic rules and the second one is based on an automatic learning of linguistic patterns. We have shown that this mixed approach leads to a significant improvement of extraction performances.

Mots clés : Extraction d’information, événements, approche symbolique, apprentissage de patrons linguistiques

Keywords : Text mining, events, symbolic extraction, linguistic pattern learning