Un modèle hybride pour le textual data mining : un mariage de raison entre le numérique et le linguistique
Ismaïl Biskri, Sylvain Delisle
Résumé : Une des recherches de pointe menée actuellement en informatique est l’extraction des connaissances dans un texte électronique (textual data mining). Ce thème de recherche est de première importance pour les technologies de l’information qui sont confrontées à des marées de documents électroniques. Pour résoudre ce problème, plusieurs stratégies sont possibles : les unes relèvent des mathématiques et les autres de l’informatique linguistique. Nous présentons dans cet article un modèle hybride, à la fois robuste et fin, qui s’inspire des modèles neuronaux et de l’analyse linguistique informatique.