talnarchives

Une archive numérique francophone des articles de recherche en Traitement Automatique de la Langue.

Un modèle hybride pour le textual data mining : un mariage de raison entre le numérique et le linguistique

Ismaïl Biskri, Sylvain Delisle

Résumé : Une des recherches de pointe menée actuellement en informatique est l’extraction des connaissances dans un texte électronique (textual data mining). Ce thème de recherche est de première importance pour les technologies de l’information qui sont confrontées à des marées de documents électroniques. Pour résoudre ce problème, plusieurs stratégies sont possibles : les unes relèvent des mathématiques et les autres de l’informatique linguistique. Nous présentons dans cet article un modèle hybride, à la fois robuste et fin, qui s’inspire des modèles neuronaux et de l’analyse linguistique informatique.