talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Apport des dépendances syntaxiques et des patrons séquentiels à l'extraction de relations

Kata Gábor, Nadège Lechevrel, Isabelle Tellier, Davide Buscaldi, Haifa Zargayouna, Thierry Charnois

Résumé : Dans cet article, nous étudions la contribution de propriétés syntaxiques à la tâche de clustering d’instances de relations sémantiques. Les instances, constituées de couples de concepts apparaissant dans des textes scientifiques, sont représentées dans une matrice où on les croise avec une représentation de leur contexte de co-occurrence. Différentes variantes de représentations sont envisagées pour ce contexte, en faisant appel à la fouille de données séquentielles et à l’analyse syntaxique en dépendances. Nos comparaisons suggèrent que les attributs issus d’analyses syntaxiques permettent d’améliorer la qualité du clustering final.

Mots clés : Extraction d’Information, relations sémantiques, apprentissage non supervisé.