talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Enrichissement de données en breton avec Wordnet

Annie Foret

Résumé : Nous décrivons une expérience d’enrichissement automatique de données en breton. Les données sont des unités de texte en breton. Certaines unités sont enrichies avec des synsets (synonym sets) de Wordnets en exploitant d’une part les ressources d’Apertium pour la paire de langues breton et français et d’autre part des ressources de type Wordnet pour le français et pour l’anglais. Le résultat peut-être visualisé et exploré de diverses manières : notre réalisation est sous forme de système d’information interactif. Notre approche repose d’une part sur des chaînes automatiques de traitements linguistiques en breton et en français et sur un environnement d’exploration de systèmes d’information logiques.

Mots clés : breton, lexique, wordnet, système d’information, recherche d’information, sémantique.