Big Data : arnaque ou réalité ?

Après plus de 5 ans, le phénomène de Big Data n’était-il finalement qu’une mode ? Les besoins du big data sont-ils réels ou ont-ils été inventés par le tapage médiatique ? Nous pouvons répondre par la négative ! Le Big Data n’est pas une mode, et ses opportunités sont bien réelles.

Les entreprises sont-elles véritablement prêtes pour le Big Data ?

En Juin dernier, le magasine informatique Le MagIT nous a posé la question suivante :
Juvénal, votre ouvrage Hadoop – Devenez opérationnel dans le monde du Big Data aborde le problème de la compréhension des technologies Hadoop. Selon vous, les entreprises françaises ont-elles atteint un niveau de maturité suffisant pour faire éclore des projets en production réelle, et non plus se cantonner aux PoC sans vrai usage à valeur ?
En clair, le journaliste voulait savoir si au-delà des PoC (Proof of Concept), les entreprises avaient réellement des besoins relatifs au Big Data. 

En tant que professionnel directement impliqué dans la valorisation des données en entreprise, nous pouvons vous assurer que oui, les entreprises ont de réels besoins en matière de Big Data  ! Cependant, selon notre constat, ces besoins ne dépendent pas de leur niveau de maturité sur le sujet, mais plutôt de leur niveau de prise de conscience sur la façon dont elles peuvent utiliser les données pour améliorer leur business. A cela, nous avons constaté qu’il y’a d’une part le très faible nombre d’entreprises qui sont juste en observation, elles regardent le Big Data de loin et ne sont pas focalisées sur l’avenir ; c’est dans ces dernières qu’on retrouve des PoC. Ces entreprises considèrent surtout le Big Data comme un levier de réduction de coûts (notamment grâce à Hadoop) qui leur permet de gérer le stockage de leur volume de données plus efficacement grâce à l’agilité qu’il apporte. 

D’autre part, il y’a les entreprises qui sont résolument tournées vers le futur. Ces entreprises opérationnalisent leurs projets Big Data et les mises en production (MEP) y sont une réalité. Pour que vous estimez en volume le poids que représentent ces entreprises, laissez-nous vous donner quelques chiffres : avec une croissance de près de 40 % par an, le marché du Big Data représente déjà depuis 2016, plus de 246 milliards d’euros. Selon une étude menée par DELL EMC, 74 % des entreprises européennes sont convaincues de l’intérêt du Big Data et donc d’Hadoop pour leurs activités. Une autre de ses études publiée en avril 2014 affirmait que 41 % des entreprises de taille moyenne avaient entamé un ou plusieurs projets impliquant Hadoop. En France, le plan Big Data pour la Nouvelle France industrielle (NFI) dont la feuille de route a été validée en juillet 2014, a déclenché une impulsion économique émanant de l’État visant à développer la valorisation du « capital donnée ». Ce plan  puise sa force de l’écosystème dynamique des entreprises françaises et des grands groupes du CAC40. Orange, La Poste, GDF Suez, Alstom, AXA, Société Générale sont autant d’entreprises qui ont été sélectionnées pour participer aux grands travaux du plan initié par l’ex-ministre Arnaud Montebourg, et désormais porté par François BOURDONCLE (cofondateur d’EXALEAD, aujourd’hui filiale de Dassault Systèmes) et Paul HERMELIN  (PDG de CAPGEMINI à ce jour). Le projet repose à ce jour sur 9 solutions qui couvrent l’économie des données, les objets intelligents, la confiance numérique, l’alimentation intelligente, les nouvelles ressources, les villes connectées, la mobilité économique, les transports de demain et la médecine du futur.  Autant vous dire que l’engouement pour le Big Data est bien réel en France et partout ailleurs en Europe, pas au même rythme qu’aux Etats Unis, mais il est bien réel.  D’ailleurs, dans notre ouvrage Hadoop – Devenez opérationnel dans le monde du Big Data, nous expliquons 2 projets Big Data qui ont été opérationnalisés : le projet Karma d’Air France et le projet Smart Grid d’EDF. 

Les besoins du Big Data

OK, tout cela semble un peu macro. Concrètement, au niveau de la vie de tous les jours, les besoins des entreprises en matière de Big Data tournent autour de 2 sujets  : la mise en place d’un data lab et l’industrialisation des analyses de données (reporting, data mining, etc.) .

1- La mise en place d’un Data Lab

Le premier besoin majeur des entreprises en ce qui concerne le Big Data actuellement est la mise en place d’un point d’accès unique de la donnée de toute l’organisation, ce qui passe naturellement par la mise en place d’un centre de données. Certaines qualifient ce centre de Data Lab (laboratoire de données), d’autres de Enterprise Data Hub (Hub de données), d’autres encore de Data Lake (Lac de donnée). Vous avez compris l’idée.  Les enjeux associés au Data Lab sont :
–  avoir une vision globale sur leur activité afin de soutenir la prise de décision  ;
– répondre aux exigences de réglementation en vigueur. Par exemple les réglementations Bâles, les réglementations Sarbannes Oxley et récemment les réglementations RGPD (Réglementation Européenne sur la Protection des données). 

2- L’industrialisation de l’Analytics

Le deuxième besoin crucial des entreprises en matière de Big Data est l’opérationnalisation des modèles statistiques de prise de décision. Pour beaucoup, les entreprises sont encore dans les reporting (comprenez par-là tableaux croisés dynamiques, les croisements et agrégations de plusieurs sources de données. Sauf dans quelques secteurs d’activités comme le secteur bancaire où des modèles de scoring sont utilisés pour classer les clients en fonction de leur capacité à rembourser les crédits ou pas, dans le secteur de la grande distribution, les modèles de classification et de recommandation sont utilisés pour regrouper les clients en fonction de leurs niveau de similarité et leur recommander des produits sur la base de leurs consommations antérieures et celles des personnes qui ont le profil similaire au sien. Sinon, à part ces quelques secteurs, dans beaucoup de cas, les entreprises sont préoccupées par la performance globale de leurs différents processus métiers et cela passe par la définition des métriques de performance (KPI). L’industrialisation du calcul de ces KPI se fait aujourd’hui principalement par lot à des périodes déterminées. Avec le Big Data et la disponibilité de la puissance de calcul, les entreprises explorent le temps réel, l’industrialisation des modèles statistiques dans le but d’être plus réactive. Il y’a également un regain accru du côté de la visualisation des données pour la consommation par les métiers des résultats des analyses de données. 

Ces 2 sujets sont les points centraux autour desquels la majorité des besoins du Big Data découlent aujourd’hui. Mettre sur pied un Data Lab demande des compétences en Ingénierie de données, architecture, Infrastructure, urbanisation, gestion de projets, l’agilité (Scrum, Lean, Kanban, etc.). L’industrialisation de l’Analytics demande des compétences en Data Science, visualisation, programmation et analyse de données. 

A notre avis, ces 2 sujets ne sont pas prêts de disparaître dans les 5 ou 10 prochaines années à venir. Restez donc assurer que les besoins en Big Data sont réels et les opportunités sont bien présentes. 

Si vous souhaitez aller plus loin dans les tendances du Big Data, nous vous recommandons de vous procurer l’ouvrage :

>