Résumé :
|
Ainsi bien que très riche en données, notre monde est pauvre en information. Par manque d'outils permettant d'extraire les connaissances utiles à partir des données brutes, les bases de données sont inexploitables, et les décisions sont plus souvent prises sur la la base d'intuitions que d'informations valables. Aujourd'hui, le gouffre qui sépare données et information est peu à peu comblé par le développement des techniques de data mining. Le Data mining est un processus essentiel où des méthodes intelligentes sont appliquées pour extraire des éléments remarquables, des patterns. Il s'agit de configurations de données dont la structure est inhabituelle, qui présentent des corrélations imprévues, des écarts statistiques, ou tout ce qui sort de l'ordinaire. Les outils de data mining ne sont pas tous basés sur les mêmes principes. Différentes méthodes peuvent être utilisées en fonction de la nature des données dont on dispose, et des informations recherchées. Voici quelques unes des techniques les plus couramment employées : - Statistiques, - Raisonnement basé sur la mémoire (RBM), - Découvertes de règles, - Arbres de décision, - Pattern recognition, - Réseaux neuraux, - Apprentissage automatique, - Fuzzy set theory, - Détection automatique des clusters, - Analyse des liens, - Algorithmes génétiques, - Réseaux bayesiens. - Les systèmes combinent plusieurs de ces techniques. Depuis quelques années une nouvelles approches a vu le jour, cette approche concerne utilisation des machine à large support (Support Vecteur Machine :SVM) dans le cadre de l’analyse de données. Travail demandé • Bien comprendre le domaine de l’analyse des bases de données. • Refaire un état de l’art des méthodes existantes. • Proposer une application de la méthode SVM dans le cas d’une base de données.
|