Accueil > Big Data, IA > NoSQL : découverte des solutions & architecture de la donnée
Formation #BSI62

Formation NoSQL : découverte des solutions & architecture de la donnée

Durée : 3 jours

Code : BSI62


Prochaines dates programmées :

Du 08 au 10 Mai 2024

Du 24 au 26 Juil. 2024

Du 25 au 27 Sept. 2024

Du 13 au 15 Nov. 2024

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Identifier les différences entre SGBD SQL et SGBD NoSQL
  • Découvrir l’écosystème NoSQL
  • Appréhender les notions relatives aux systèmes distribués et à la donnée (cohérence, théorème de CAP, etc.)
  • Identifier les différents cas d’usage de la donnée
  • Comprendre les plateformes de streaming de la donnée (Storm, Spark...)
  • Observer l’écosystème Hadoop
Programme
1/ Les bases de données avant l’apparition du NoSQL
  • Forme normale des bases de données relationnelles
  • Baisse des coûts hardware
  • Notion de "Transaction"
  • Systèmes distribués et disponibilité prennent le dessus sur la cohérence (CAP)
2/ Introduction au NoSQL
  • L'historique NoSQL
  • Les cinq « V » du big data : Volume, Variété, Vélocité, Véracité, Validité
  • Données non structurées
  • Grands acteurs à l'origine du NoSQL et du big data analytique
  • Le NoSQL, le big data et les architectures cloud : principes
  • Les modes de distribution : avec maître et décentralisé
  • Le positionnement du NoSQL au sein du big data analytique
  • Définition "Réplication"
  • Définition "Sharding"
3/ NoSQL et Big Data
  • Big data analytique : l'écosystème Hadoop
  • Stockage et traitements
  • Les différentes formes de stockage dans HDFS
  • Fonctions et usages :
  • moteurs de recherche
  • outils de suggestion commerciale
  • détecteurs d'intrusion
  • ...
  • Différents types de traitements :
  • MapReduce, graphe orienté acyclique
  • flux
  • machine learning
  • graphes distribués
  • ...
  • Outils et algorithmes :
  • moteurs de recherche
  • Google Search
  • l'algorithme PageRank
  • L'outil intégré : Apache Spark
  • Connexion avec les moteurs opérationnels : ETL, Apache Sqoop
4/ Les familles de base de données NoSQL
  • Key-value
  • Document
  • Graph
  • Colonne
5/ Le monde Hadoop
  • Focus sur l’offre Colonne avec Cassandra
  • Présentation générale, architecture et cas pratique
  • Séries temporelles, objets connectés
  • Frameworks de traitement distribué
6/ Focus sur l’offre clé-valeur et document avec Couchbase et MongoDB
  • Présentation générale, architecture et cas d’utilisation
7/ Search - fédération de données
  • Présentation de l’offre Elasticsearch
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • DSI
  • Directeur de projet
  • Chef de projet
  • Architecte (Logiciel/Entreprise/Technique)
  • Développeur
Dates

Dates

  • Du 08 au 10 Mai 2024
  • Du 24 au 26 Juil. 2024
  • Du 25 au 27 Sept. 2024
  • Du 13 au 15 Nov. 2024
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.