Fin d'Inscription : Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)
Présentation de Storm : fonctionnalités, architecture, langages supportés
Définitions : spout, bolt, topology
Apache Storm dans le projet Hadoop
Storm et Spark Streaming : différences des modes de traitement de données
Du Map Reduce aux topologies de Storm
Développement et déploiement de topologies
Modèle de données (clé, valeur)
4/ Architecture apache Storm
Étude des composants d'un cluster Storm : master node "nimbus" et worker nodes
Positionnement par rapport à un cluster Hadoop
Le modèle de données
Différents types de flux
Rôles des Nimbus et ZooKeeper
La relation entre Nimbus et Supervisors
Le cluster intermédiaire de Zookeepers et leurs relations avec les Nimbus et Supervisors
Définition de l'environnement de développement
Création de projets basés sur Storm
Les composants primitifs : Spouts et Bolts
Comprendre le cycle de vie du déploiement d’une topologie
Paramétrer la communication interne de Storm
5/ Premiers pas avec Storm
Configuration d'un environnement de développement
Installation d'un cluster Storm
Le projet storm-starter
6/ Gestion des flux de données
Définition des flux
Les différentes stratégies de distribution de données
Implémenter des stratégies personnalisées
Réaliser des jointures sur les flux
Création de topologies regroupants des flux entre différents noeuds
Communication entre flux en JSON
Lecture de flux d'origines diverses (JMS, Kafka, …)
7/ Haute disponibilité
Tolérance aux pannes : principe de fiabilisation des master node, workers node, nimbus
Garantie de traitement des flux : principe, paramètres TOPOLOGY_MESSAGE_TIMEOUT_SECS, TOPOLOGY_ACKERS
Traitements temps réel avec Trident
Scalabilité horizontale : Notion de taux de disponibilité, Ajouter des serveurs d’application web , Scalabilité des bases de données
8/ Parallélisme des topologies
Schéma d’exécution d’une topologie (Worker, Executor, Task)
Maîtriser et provisionner la parallélisation d’une topologie
Techniques de « Rebalancing »
9/ Fiabilité de traitement des messages
Le mécanisme de suivi des messages
Le cycle de vie d’un message
Traiter les messages avec l’API Java
Définir la fiabilité avec l’API Storm
Assurer la fiabilité d’une application : méthodes et stratégies
10/ Gérer l’exécution des topologies
Utiliser les Storm Metrics
Supervision avec les commandes Storm CLI
Storm UI
Approche Pédagogique
Approche Pédagogique
Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
Cas pratiques
Remise d’outils
Echanges d’expériences
Public cible
Public cible
Chefs de projets
Data scientists
Développeurs
Dates
Dates
Du 05 au 07 Juin 2024
Du 28 au 30 Août 2024
Du 09 au 11 Oct. 2024
Du 11 au 13 Déc. 2024
Fin d'Inscription : Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.