Selon l’ancien PCA de Google EricSchmidt,  l’humanité produit tous les 2 jours autant de données qu’elle n’en a générée depuis l’aube de la civilisation jusqu’en 2003. Selon les études de l’IDC, cela correspond à 2 Go de données produits tous les jours par chaque homme, femme et enfant sur la planète. Pour qualifier cette explosion massive de données, le qualificatif « Big Data » a été adopté. Les entreprises ont compris les enjeux que représentent les données et ont lancé leur projet Big Data. Dans cet article, nous allons vous fournir 4 clés que vous devez utiliser pour garantir la réussite de votre projet Big Data. Ces clés sont extraites de l’ouvrage « Hadoop – Devenez opérationnel dans le monde du Big Data » dont nous sommes l’auteur.

#Clé 1 :comprenez que les opportunités du Big Data ne se situent pas dans le volume des données, mais dans la transformation digitale de vos processus métiers.

Le Big Data est perçu aux yeux de tous comme étant l’explosion du volume de données, la taille phénoménale du volume de données produite par les activités du Numérique. Pour les professions plus techniques, le Big Data ce sont les 3V, Volume, Vitesse, Vélocité des données. D’ailleurs, cette perception volumique du Big Data est tellement encrée dans les mœurs que la commission générale de terminologie et de néologie française a décidé qu’on appellera désormais « Big Data » officiellement par « mégadonnées » et y a associé la définition suivante : « données structurées ou non dont le très grand volume requiert des outils d’analyse adaptés ». Malheureusement, concevoir le Big Data sous un aspect purement volumique c’est :

  • minimiser le potentiel économique de la donnée pour l’entreprise ;
  • limiter sa perception de la transformation numérique qui est en cours ;
  • et passer à côté de la réalité que le Big Data cache véritablement ;

Si vous voulez réussir vos chantiers Big Data, vous devez comprendre que le Big Data n’est pas avant tout un phénomène de volumétrie de données, c’est un phénomène social. C’est la partie visible de la transition du monde de l’ère industrielle à l’ère Numérique. Plus concrètement, c’est l’expression de 2 facteurs : la mise à disposition d’Internet entre les mains du grand public et l’augmentation du nombre de personnes connectés à Internet.  En effet, la vulgarisation d’Internet a entraîné la digitalisation des activités des entreprises, celle-ci est survenue au même moment que l’augmentation du nombre de personnes connectées à Internet par le biais des Smartphones et autres gadgets. Aujourd’hui, il n’y’a plus qu’à travers les smartphones que les utilisateurs sont connectés à Internet,  ils y sont aussi par le biais des véhicules (on parle de véhicules connectés), de leur maison (maison connectés), ainsi de suite. Toutes ces activités digitales génère des données. Combinez à toutes ces activités le nombre d’internautes (ou d’objets) connectés à Internet et vous vous retrouvez très vite avec un volume de données sans précédent. Mais le point est de montrer que le ‘Big’ du Big Data est juste une résultante, une conséquence et non une cause. Attaquer son projet Big Data selon l’aspect volumique c’est attaquer la conséquence et non la cause. Ainsi, si vous voulez réussir votre projet Big Data, changez d’angle d’attaque !  Intéressez-vous plus à la façon dont vous allez « digitaliser » vos processus métiers qu’au volume de données qu’ils produisent.

#Clé 2 :ayez un but en tête pour votre projet Big Data

On ne le dira jamais assez : « il n’y’a pas de bon vent pour celui qui ne sait pas où il va ».  Le succès de votre projet Big Data est associé au niveau de clarté de ce que vous voulez atteindre avec ce projet. Ceci n’est pas juste valable en Big Data, mais dans tout projet. Vous devez définir clairement ce que vous voulez avant d’entreprendre quoi que ce soit.  Le Big Data  fait l’objet d’une telle effervescence médiatique que le marché se retrouve dans la confusion. Selon les constats de plusieurs experts, « le Big Data c’est comme le sexe chez les discussions d’adolescents, tout le monde en parle, mais personne n’en fait ».  Peut-être vous avez lancé votre projet Big Data sous la pression de vos paires, la pression de dire que vous aussi vous « faites » du Big Data. Auquel cas, ce n’est pas grave. Vous devez simplement être conscient que le Big Data est l’expression d’un phénomène social et que le véritable enjeu d’un projet Big Data ne se trouve pas sur les données, mais sur la transformation numérique de vos processus métiers (ce que le marché qualifie par « digitalisation de l’entreprise» ). En tant que projet, le Big Data est un projet comme tous les autres, il nécessite que vous lui fixez un but, définissez les ressources financières, humaines et logistiques qui seront nécessaires pour atteindre ce but définissez le périmètre d’impact, le placiez sur la responsabilité d’un ou plusieurs directions de l’entreprise et fixez une date pour sa mise en œuvre, son évaluation et sa fin.  Si vous n’êtes pas encore conscient des buts que vous pouvez atteindre avec un projet Big Data, vous pouvez commencer avec un PoC (Proof Of Concept) et en utilisant une méthode itérative, raffiner votre but au fur et à mesure en fonction des résultats et des orientations que vous aurez obtenu de ce PoC. De toute façon, il est très rare d’avoir une vision très claire dès le départ, généralement, la vision devient claire au fur et à mesure que l’on progresse. Dans notre ouvrage « Hadoop – Devenez opérationnel dans le monde du Big Data », nous vous expliquons la vision du projet Big Data  SmartGridd’EDF et KARMA d’Air France.

#Clé 3 : choisissez votre équipement et faites-vous accompagner

L’approche traditionnelle de gestion des données consiste à centraliser le stockage et le traitement des données dans un serveur central dans une architecture client/serveur. Ces données sont gérées dans le serveur par un SGBDR. Malheureusement, les approches traditionnelles de gestion de données ont de plus en plus de mal à s’adapter aux contraintes du Big Data, qui sont nouvelles. Pour  gérer les contraintes de cette explosion de données, l’approche technologique ne consiste plus à centraliser le stockage et le traitement des données dans un seul serveur, mais à distribuer le stockage et à paralléliser le traitement de ces données sur plusieurs ordinateurs (on parle dans le jargon des nœuds d’un cluster). Hadoop  est  l’implémentation logicielle la plus mature  de cette approche technologique. Il est utilisé aujourd’hui au moins en pilote par toutes les entreprises qui souhaitent se lancer dans l’exploitation à grande échelle  de leurs données.  Pour utiliser Hadoop, nous vous recommandons de choisir une distribution Hadoop. Il y’a en actuellement trois principales sur le marché : CDH de Cloudera,  HDP de Hortonworks et CDP de MapR. Dans le chapitre 10 de notre ouvrage « Hadoop – Devenez opérationnel dans le monde du Big Data », nous vous expliquons les 7 critères sur lesquels vous devez vous appuyer pour choisir votre distribution Hadoop.

#Clé 4 :évitez le comportement de grenouille

L’un des plus gros écueils à la réussite de votre projet Big Data ou la réussite de tout autre projet d’ailleurs est la résistance au changement. Nous sommes naturellement averse au changement, cela est souvent dû au poids des habitudes. Le Big Data représente un changement, le changement d’une époque à une autre, le passage d’une ère industrielle à une ère Numérique. Ce changement est inéluctable et  se fera avec ou sans notre accord. Le comportement de grenouille est un type de résistance au changement qui consiste à nier la réalité. Kodak  et Nokia sont deux exemples d’entreprises qui se sont comportées en grenouille. Kodak a voulu imposer sa vision de l’image dans la durée et a nié la réalité de l’image numérique portée à l’époque par des entreprises comme Xerox et Fujifilm. Malheureusement, ce déni de réalité et cet acharnement à continuer de fonctionner avec un produit d’une autre époque lui coûté sa vie. Nokia quant à elle a sous-estimé voir ignoré l’impact progressif de l’iPhone lancé par Steve Jobs d’Apple sur la culture et ainsi manqué le train des smartphones. Comme Kodak, cette erreur lui a été fatale et le 11 Novembre 2011 elle est rachetée par Microsoft. Le Big Data est l’expression d’un changement qui va obliger tous les acteurs économiques à revoir la façon dont ils créent la valeur (le business model) pour leurs clients, leurs employés, leurs fournisseurs et l’Etat.

En complément de ces 4 clés, vous trouverez dans le chapitre 21 de l’ouvrage « Hadoop – Devenez opérationnel dans le monde du Big Data », d’autres clés comme le comportement de crabe, la présomption, le changement de mentalité  qu’il est indispensable d’appliquer pour voir  votre projet Big Data rencontrer une grande réussite ! Pour plus de détails sur l’ouvrage « Hadoop Devenez opérationnel dans le monde du Big Data »


Juvénal JVC

Juvénal est spécialisé depuis 2011 dans la valorisation à large échelle des données. Son but est d'aider les professionnels de la data à développer les compétences indispensables pour réussir dans le Big Data. Il travaille actuellement comme Lead Data Engineer auprès des grands comptes. Lorsqu'il n'est pas en voyage, Juvénal rédige des livres ou est en train de préparer la sortie d'un de  ses livres. Vous pouvez télécharger un extrait de son dernier livre en date ici : https://www.data-transitionnumerique.com/extrait-ecosystme-hadoop/

>