Travailler de façon professionnelle dans le Big Data exige que vous vous spécialisiez dans l’un des métiers suivants : Travailler dans le Big Data – les 7 métiers porteurs à l’horizon 2020-2022 et que vous développiez les compétences suivantes : les 6 compétences de base pour travailler dans le Big Data. Dans cet article, nous allons vous présenter les formations et les moyens disponibles pour développer vos compétences et travailler dans le Big Data.
Globalement, vous avez 3 moyens pour vous former dans le Big Data et développer vos compétences : suivre un Master spécialisé, passer une certification ou participer à des Kaggles & Meeting Up.
1- Les Masters spécialisés
Le moyen le plus évident pour développer vos compétences est de suivre un programme de Master spécialisé. Attention, lorsque nous parlons de Master spécialisé, nous ne faisons pas référence à un diplôme d’établissement français labellisé par la conférence des grandes écoles, ni à un diplôme post-master (diplôme qui s’obtient après un master). Nous faisons référence à tout master, que ce soit public, privé, accrédité par une conférence de grandes écoles ou pas, qui fournit exclusivement des enseignements sur le Big Data. Le but d’un tel Master est de mettre à votre disposition l’infrastructure nécessaire pour apprendre les technologies du Big Data, Hadoop notamment. Certains masters peuvent rajouter à cela des enseignements métiers, montrant les aspects non-techniques de la donnée, comme les aspects juridiques par exemple. Sur la base de leur crédibilité et de leur réputation, nous allons vous présenter brièvement les 3 masters spécialisés suivants. Attention, ne voyez pas dans le choix de ces trois masters une sorte de discrimination ou de publicité. Nous citons ceux-ci uniquement sur la base de notre connaissance personnelle (les responsables des masters ne sont même pas au courant que nous avons cité leur Master, ils ne nous connaissent même pas) :
- Le Master Spécialisé Big Data de Telecom ParisTech : Télécom ParisTech est une école d’ingénieurs qui offre un Master spécialisé en Big Data sur un an intitulé « Big Data : Gestion et Analyse des données massives ». Le but de ce master est d’apporter à ses apprenants des compétences sur l’exploitation des données sur Hadoop et de compléter ces compétences par des compétences métier. De plus, Télécom Paris anime trois chaires de recherche et d’enseignement qui proposent plusieurs filières de formation autour du Big Data;
- Le Master Spécialisé Big Data de Grenoble Ecole de Management & Grenoble INP : l’école de Management de Grenoble (Grenoble-EM) offre un Master spécialisé en Big Data comme son nom l’indique qui est le fruit d’une alliance entre deux écoles : une école d’Ingénieur (Grenoble INP) et une école de Management (Grenoble EM). Ce master est accrédité par la conférence des grandes écoles de France et se tient sur une durée de 15 mois ;
- Le Master MSc Big Data de l’ESSEC & CentraleSupélec : ce master, intitulé « Master in Data Science & Business Analytics » est également le fruit d’une alliance entre une école de management (ESSEC) et une école d’ingénieurs (CentraleSupélec). Il propose au bout du troisième mois de formation une spécialisation sur le calcul massivement parallèle que vous pouvez choisir pour monter en compétence sur Hadoop. Ce master est accrédité par la conférence des grandes écoles de France et se tient sur une durée de 15 mois ;
2- Les certifications
Les certifications sont un bon moyen de développer un niveau d’expertise sur un sujet particulier ou sur une technologie particulière. La certification valide les aptitudes et les compétences acquises sur un sujet et peuvent être un bon moyen de vous positionner comme expert sur le sujet dans le marché (j’en possède moi-même 6). Si vous souhaitez suivre ce chemin pour développer vos compétences en Big Data, nous vous recommandons les 3 certifications suivantes :
- Cloudera Certified Professional Data Engineer : offerte par Cloudera, cette certification couvre les aspects d’ingestion, de transformation, de stockage et d’analyse de données sur la distribution Hadoop de Cloudera en utilisant Spark SQL, Spark Shell, Hive, Spark Streaming, Kafka, Flume, Python et bien d’autres outils de la distribution. Pour passer cette certification, Cloudera recommande de suivre la formation qu’elle a baptisée Cloudera’s Spark and Hadoop Developer ;
- Hortonworks HDP Certified Apache Spark Developer : cette certification, offerte par Hortonworks, valide les compétences de développement d’applications de traitement de données en Spark, Scala, Python, et YARN. Hortonworks invite les intéressés à cette certification à télécharger la machine virtuelle contenant l’image d’HDP pour se former dessus ;
- MapR Certified Hadoop Developer : offerte par MapR, cette certification valide les compétences sur le développement des programmes MapReduce en java. L’examen teste la capacité du candidat à écrire des programmes MapReduce, à utiliser efficacement l’API MapReduce, à gérer et à suivre l’exécution des workflows MapReduce. Bien sûr la distribution Hadoop utilisée est La distribution de MapR. Pour se préparer à l’examen, MapR invite les intéressés à suivre la formation DEV 301 – Developing Hadoop Applications ;
- EMC DELL Certified Data Scientist Associate : avant d’être racheté par DELL, EMC a développé un programme de certification plus global que les programmes des éditeurs Hadoop. Ce programme couvre l’intégralité de l’exploitation de données, précisément les techniques d’apprentissage statistique sur MLib et sur R, les techniques de visualisation et de présentation de données, l’exploitation de GreenPlum, l’écriture des requêtes de traitement de données en MapReduce, HiveQL, et Pig, le stockage de données en HBase, la connaissance fonctionnelle des principaux outils de l’écosystème Hadoop et les compétences métier sur les problématiques de recommandation, de classification et d’analyse de sentiment. Pour passer cette certification, EMC recommande de suivre son cursus de formation « Data Science and Big Data Analytics » et nous vous le recommandons fortement aussi ;
Si vous n’avez pas la possibilité de suivre un Master spécialisé ou passer une certification, vous pouvez vous tourner vers les MOOC (Massive Online Open Course). Les MOOC sont des formations en ligne ouvertes à tous. Le principe des MOOC consiste à enregistrer tous les enseignements suivis dans un cursus de formation ou d’une filière et de les mettre à disposition des internautes sur une plateforme Internet capable de supporter des milliers de connexions simultanément. Le coût des MOOC est très faible voir même gratuit pour beaucoup d’entre eux (d’où l’adjectif Open Course). Beaucoup d’universités ont adopté cette philosophie et mettent leurs enseignements sur des plateformes MOOC. Ainsi, vous trouverez en MOOC les enseignements suivis dans les plus prestigieuses universités du monde comme l’Université de Stanford aux Etats Unis, l’université de Zurich en Suisse, ou encore l’Ecole des Ponts ParisTech de France. En ce qui concerne le Big Data, vous pouvez trouver des cours de spécialisation sur la plateforme MOOC Coursera. Nous ne pouvons malheureusement pas vous donner des exemples de cours car ceux-ci sont fournis sur la plateforme par période. Rendez-vous sur le site https://www.coursera.org , recherchez les cours Hadoop qui vous intéressent et inscrivez-vous. La dernière fois que nous avons suivi un MOOC Hadoop sur Coursera, cela nous a coûté autour de 200 euros.
3- Les Kaggles & Meetup
Le troisième moyen que vous pouvez utiliser pour vous lancer dans le Big Data est la participation à des Meetups et des compétitions Kaggle. Les Meetup sont des rencontres style « After work » de communautés de partage de connaissance autour du Big Data. Les Meetups sont l’occasion pour des professionnels du Big Data inscrits à la communauté d’échanger sur un retour d’expérience qu’ils ont sur un projet Big Data, ce qui permet aux uns et autres de se mettre à jour et de bénéficier du retour d’expérience des projets. De plus, des conférences sont organisées généralement tous les mois en fonction de la communauté sur un sujet précis, faisant appel à des experts. Les Meetups sont un bon moyen pour vous mettre à jour techniquement et pour étendre votre vision sur le Big Data. Si l’idée de discuter d’Hadoop avec d’autres personnes comme vous autour d’un verre un soir vous intéresse, alors nous vous recommandons de vous inscrire dans la HUG, la communauté des utilisateurs d’Hadoop en France (www.hugfrance.fr). Vous pouvez également participer à des compétitions Kaggle pour approfondir vos connaissances sur les sujets de l’exploitation de la donnée. Kaggle est une plateforme web qui organise des compétitions en Data Science. Sur cette plateforme, les entreprises proposent des problèmes d’exploitation de données et offrent un prix à ceux qui développement des algorithmes offrant les meilleures performances. Si l’idée de faire de l’argent en vous amusant vous intéresse et si vous avez l’esprit de compétition, alors n’hésitez pas à participer aux compétitions Kaggle en allant sur le lien suivant : www.kaggle.com.
Voilà, vous avez désormais toutes les cartes entre vos mains pour vous lancer dans le Big Data. Vous pouvez choisir un profil de métier ensuite, suivre un programme de master spécialisé, passer une certification éditeur, suivre un MOOC, participer à des Meetups ou participer à des compétitions Kaggle. La balle est dans votre camp.
Si vous souhaitez aller plus loin dans votre orientation, l’ouvrage « Hadoop – Devenez opérationnel dans le monde du Big Data » paru chez les éditions ENI et dont nous sommes l’auteur peut vous aider. Il est disponible ici : Livre – Hadoop-devenez-operationnel-dans-le-monde-du-big-data