Apport des dépendances syntaxiques et des patrons séquentiels à l'extraction de relations
Kata Gábor, Nadège Lechevrel, Isabelle Tellier, Davide Buscaldi, Haifa Zargayouna, Thierry Charnois
Résumé : Dans cet article, nous étudions la contribution de propriétés syntaxiques à la tâche de clustering d’instances de relations sémantiques. Les instances, constituées de couples de concepts apparaissant dans des textes scientifiques, sont représentées dans une matrice où on les croise avec une représentation de leur contexte de co-occurrence. Différentes variantes de représentations sont envisagées pour ce contexte, en faisant appel à la fouille de données séquentielles et à l’analyse syntaxique en dépendances. Nos comparaisons suggèrent que les attributs issus d’analyses syntaxiques permettent d’améliorer la qualité du clustering final.
Mots clés : Extraction d’Information, relations sémantiques, apprentissage non supervisé.