Formations Big Data & Data Science

Durée 3 jours • Prix (HT) 1890€

Introduction : Big Data & Data Science

Rappels sur l’algèbre (vecteurs et matrices) & statistiques

Machine Learning : Apprentissage automatique

  • Définition et historique
  • Exemples d’applications de l’apprentissage automatique
  • Modélisation d’un problème en Apprentissage automatique
  • Types d’apprentissage (Supervisé/Non supervisé)

Étapes de l’apprentissage

  • Choix du modèle
  • Apprentissage : calcul des paramètres du modèle
  • Sur-apprentissage (Overfitting)
  • Validation, validation croisée, test
  • Critères de comparaison de modèles

Prise en main de Python

  • Le Notebook Jupyter
  • Introduction à la programmation en Python
  • Structures et opérations de bases dans Python
  • LAB 1 : Prise en main de Python
  • Récupération des données
  • Exploration et prétraitement des données (utilisation des librairies Pandas et Numpy)
  • Visualisation des données (utilisation de la librairie Matplotlib)
  • LAB 2 : Exploration et prétraitement des données

Algorithmes d’apprentissage

Régression

  • Cas d’utilisation : Prédiction des prix de vente de maisons
  • Métriques de la régression
  • Régression linéaire
  • Principe et fonctionnement
  • Fonction coût/perte
  • Fonction d’optimisation (algorithme du Gradient Descent)
  • LAB 3 : Régression linéaire
  • Les régressions : multiple, Ridge, Lasso
  • LAB 4 : Régression multiple, régression Ridge & Lasso

Classification

  • Cas d’utilisation : Détection des mails spams
  • Métriques de la classification
  • Régression Logistique
  • SVM (Support Vector Machine)
  • LAB 5 : Régression Logistique & SVM
  • Arbres de décision
  • Forêts aléatoires
  • LAB 6 : Arbres de décision et forêts aléatoires
  • K-NN (les K plus proches voisins)
  • LAB 7 : K-NN

Segmentation & clustering

  • Cas d’utilisation : Segmentation des articles
  • Distances
  • K-moyennes (K-Means)
  • LAB 8 : K-moyennes
  • Spectral clustering
  • Hierarchical clustering
  • LAB 9 : Spectral & Hierarchical clustering

Systèmes de recommandations

  • Cas d’utilisation : Système de recommandation pour un site de e-commerce
  • Content-based filtering
  • LAB 10 : Content-based filtering
  • Collaborative filtering (filtrage collaboratif)
  • LAB 11 : Collaborative filtering

Réduction de dimension

  • Cas d’utilisation : exemple de l’Iris data
  • PCA (Principle Component Analysis)

Apprentissage profond : Deep learning

  • Cas d’utilisation : Classification d’images
  • Réseaux de neurones perceptron multicouches
  • Réseaux de neurones à convulsion
  • Réseaux de neurones récurrents
  • Réseaux autoencoders

Challenges et perspectives