talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Inférence automatique de contextes distributionnels

Hervé Déjean

Résumé : Nous allons présenter, dans cet article une méthodologie permettant d'une part la définition des catégories distributionnelles des mots d'une langue et d'autre part un algorithme réalisant cette catégorisation. Ce travail ne se base que sur des critères formels. Aucune connaissance lexicale ou sémantique n'est requise. Ces critères formels ayant l'avantage d'être applicables à un grand nombre de langues, la méthode est donc multilingue. Le critère de catégorisation repose sur deux notions structurelles : le syntagme simple et la proposition. La découverte de ces deux structures permet la mise à jour de classes particulières qui vont correspondre à nos catégories distributionnelles.