Pandas

Du fait de sa puissance de calcul, Python est devenu le langage de référence en mathématiques et donc pour les datas sciences.
Langage open source, Python possède de plus d’excellentes librairies pour les calculs mathématiques dont numpy et pandas.
Pandas est une librairie permettant d'analyser avec efficacité des structures de données complexes.
Pandas permet de manipuler des matrices dont chaque colonne peut être d'un type différent et offrant de nombreuses et puissantes fonctionnalités de manipulation, réduction, recherche et statistiques.
Cette formation vous apprendra à utiliser numpy et Pandas pour vos besoins en data sciences.

Durée

.

Publics cibles

Développeurs, Data analyste

Pré-requis

Python

Objectifs

  • Savoir gérer, manipuler et analyser des données avec le module Pandas en langage Python
  • Etre capable de développer des programmes Python utilisant Pandas

Informations

Cette formation est accessible en présentiel et à distance (classe virtuelle)

Programme détaillé

Introduction

  • Les avantages de Python pour le calcul scientifique
  • Présentation des librairies principales
  • Les data sciences
  • Installation des outils

Numpy

  • Introduction
  • Les tableaux
  • Création de tableaux
  • Sélection de données,Calculs
  • Filtres
  • Association de tableaux
  • Entrée / Sortie : formats de fichier standard
  • Fonctions

Pandas

  • Les Séries
  • Les DataFrames
  • Création de Série et de DataFrame
  • Sélection des données
  • Agrégation
  • Entrées et sorties via les fichiers .csv
  • Fusion de DataFrame
  • Manipulation de série temporelles
  • Utilisation d'une base de données


Pandas

Interressé par cette formation ? Contactez-nous pour recevoir plus d'informations