Big Data & Streaming
-
Les ressources complémentaires

Nous vous recommandons les ouvrages suivants en guise de ressources complémentaires à l'ouvrage ou au kit de formation "Big Data & Streaming". Ces ressources vous permettront de creuser en profondeur certains aspect du Big Data Streaming

Hadoop - Devenez opérationnel dans le monde du Big Data

Pour toutes les questions relatives au traitement parallèle, aux principes du stockage distribué, aux architectures de calcul massivement parallèles nécessaires pour valoriser à large échelle les données en Big Data, nous vous recommandons cet ouvrage. Cliquez sur le  lien suivant pour l'obtenir : Hadoop - Devenez opérationnel dans le monde du Big Data

Maîtrisez l'utilisation des technologies Hadoop

Pour traiter les données streaming à large échelle, un écosystème de technologies est nécessaire. Par exemple, YARN, Hadoop, Oozie, etc. Pour apprendre les concepts et les outils de l'écosystème Hadoop nécessaires pour le Big Data Streaming, nous vous recommandons cet ouvrage. Cliquez ici pour l'obtenir : Maîtrisez l'utilisation des technologies Hadoop

Designing Data-Intensive Applications

Traiter les données à large échelle, du moins à l'échelle du Big Data nécessite de faire de nombreux arbitrages technologiques. Par exemple, accroître le niveau de disponibilité d'un système de gestion de données ou sa performance implique souvent une baisse de son niveau de cohérence. Dans cet excellent ouvrage, Martin Kleepmann explique de façon exhaustive tous les arbitrages à faire pour mettre au point un système massivement parallèle pour valoriser les Big Data. Dans ces arbitrages, vous découvrirez également les arbitrages à faire pour les systèmes de traitement streaming. Vous pouvez vous procurer l'ouvrage en cliquant ici : Designing Data-Intensive Applications

Streaming Data

Cet ouvrage se spécialise spécifiquement sur les challenges et les arbitrages de la valorisation des données streaming. L'auteur met un accent particulier sur les concepts fondamentaux à posséder pour aborder avec aisance la gestion des données streaming à large échelle. Après la lecture de cet ouvrage, vous aurez développé une bonne fondation pour la valorisation des données streaming. Cliquez ici pour obtenir l'ouvrage : Streaming Data

Principles & best practices for scalable real time data systems

Nathan Martz est l'un des auteurs qui a le plus travaillé sur les architectures informatiques nécessaires pour valoriser les données produites en streaming ou qui doivent être traitées en temps réel. Cet ouvrage résume très bien ses travaux. Plus concrètement, vous avez vu dans l'ouvrage ou dans le kit de formation qu'il existe actuellement 4 architectures efficaces et scalables pour traiter les données en temps réel : l'architecture streaming, l'architecture hybride, l'architecture kappa et l'architecture lambda. Après la lecture de cet ouvrage, vous aurez une connaissance plus approfondie de ces architectures. Pour vous le procurer, cliquez sur le lien suivant : Big Data Prinicples for scalable real-time data systems