Data Mining

Human can only process a certain amount of data. Therefore finding relations between those massive amount of data becomes impossible. Data mining brings solutions to extract knowledge from raw data to isolate emerging links between those data. Done properly and the IT will greatly improve.

This training will teach you the ABC's of Data Mining, what it can bring to the Organization and the most commonly used tools to do it !

Duration

.

Audience

  • Développeurs,
  • Chef de projet,
  • Data analyste

Prerequisite

Have a good understanding and practice of one SQL language (T-SQL, PL/SQL, ....).

Objectives

  • Comprendre les principes et la finalité du Data Mining (DM)
  • Identifier les principales techniques du DM et leur cas d'utilisation
  • Mettre en œuvre sur un cas simple les méthodes de scoring et de géomarketing
  • Découvrir les méthodes prédictives et les méthodes descriptives du DM
  • Connaître les principales étapes d'un projet Data Mining

Information

This training can be provided on Site / Prem's, remotely, in Class.

Detailled program

Système d'Information Décisionnel

  • Les enjeux du SID : besoins, domaines d'application.
  • Architecture type d'un SID, état de l'art.
  • Elaboration des informations décisionnelles.
  • Conception d'un SID : étapes, optimisation, organisation des données, dictionnaires.

Data Mining

  • Définition et finalité du Data Mining (DM).
  • Quel lien entre le DM et les statistiques, quelle dépendance entre le DM et l'informatique ?
  • Différence entre DM et OLAP ?
  • Les attentes des entreprises, les réponses du DM.

Techniques du Data Mining

  • Les différentes familles du DM.
  • Les méthodes prédictives et les méthodes descriptives.
  • Analyse factorielle, typologique. La classification…
  • Les arbres de décisions, les réseaux de neurones.
  • Classification des techniques de DM.

Clustering

  • Définition et méthodologie.
  • Les critères pour structurer les données à classer.
  • Evaluation et validation des classes obtenues.
  • Les différentes sous-familles du Clustering.

Applications

  • Le scoring : définition, finalité, méthodologie.
  • Le géomarketing : définition, finalité, méthodologie.
  • Qualité des données et administration des données.
  • Processus de collecte et d'exploration.
  • Création d'agrégats et de nouvelles données.
  • Transformation des données.

Gérer un projet Data Mining

  • Définition du problème métier à résoudre et des objectifs à atteindre.
  • Inventorier, décrire et classer les données.
  • Concevoir et alimenter la base Data Mining.
  • Explorer, segmenter des entités analysées.
  • Etablir et appliquer les modèles d'analyse.
  • Itérer, déployer auprès des utilisateurs.
  • Maintenir le modèle et le logiciel associé.
  • Principaux outils du marché : SAS, R, IBM SPSS…
  • Quels critères de choix pour ce type d'outils ?


Data Mining

Interrested by this training ? Please contact us for more details.