Data Mining

Analyser un nombre trop important de données est quasiment impossible pour un être humain. Trouver des relations entre ces données encore plus. Le Data Mining apporte des solutions pour l'extraction de connaissances à partir de données brutes afin de trouver des relations émergentes entre elles et donc améliorer votre système d’information. Cette formation vous apprendra ce qu’est le Data Mining, ses applications, ses apports pour l'entreprise ainsi que sur les méthodes et outils les plus utilisés.

Durée

.

Publics cibles

Développeurs, Chef de projet, Data analyste

Pré-requis

Connaître au moins un langage de programmation, SQL (T-SQL, PL/SQL, ....)

Objectifs

  • Comprendre les principes et la finalité du Data Mining (DM)
  • Identifier les principales techniques du DM et leur cas d'utilisation
  • Mettre en œuvre sur un cas simple les méthodes de scoring et de géomarketing
  • Découvrir les méthodes prédictives et les méthodes descriptives du DM
  • Connaître les principales étapes d'un projet Data Mining

Informations

Cette formation est accessible en présentiel et à distance (classe virtuelle)

Programme détaillé

Système d'Information Décisionnel

  • Les enjeux du SID : besoins, domaines d'application.
  • Architecture type d'un SID, état de l'art.
  • Elaboration des informations décisionnelles.
  • Conception d'un SID : étapes, optimisation, organisation des données, dictionnaires.

Data Mining

  • Définition et finalité du Data Mining (DM).
  • Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l'informatique ?
  • Différence entre DM et OLAP ?
  • Les attentes des entreprises, les réponses du DM.

Techniques du Data Mining

  • Les différentes familles du DM.
  • Les méthodes prédictives et les méthodes descriptives.
  • Analyse factorielle, typologique. La classification…
  • Les arbres de décisions, les réseaux de neurones.
  • Classification des techniques de DM.

Clustering

  • Définition et méthodologie.
  • Les critères pour structurer les données à classer.
  • Evaluation et validation des classes obtenues.
  • Les différentes sous-familles du Clustering.

Applications

  • Le scoring : définition, finalité, méthodologie.
  • Le géomarketing : définition, finalité, méthodologie.
  • Qualité des données et administration des données.
  • Processus de collecte et d'exploration.
  • Création d'agrégats et de nouvelles données.
  • Transformation des données.

Gérer un projet Data Mining

  • Définition du problème métier à résoudre et des objectifs à atteindre.
  • Inventorier, décrire et classer les données.
  • Concevoir et alimenter la base Data Mining.
  • Explorer, segmenter des entités analysées.
  • Etablir et appliquer les modèles d'analyse.
  • Itérer, déployer auprès des utilisateurs.
  • Maintenir le modèle et le logiciel associé.
  • Principaux outils du marché : SAS, R, IBM SPSS…
  • Quels critères de choix pour ce type d'outils ?


Data Mining

Interressé par cette formation ? Contactez-nous pour recevoir plus d'informations