cybersecurité

6 façons pour les entreprises de protéger les données de leurs clients

La protection des données des clients est devenue une préoccupation majeure pour les entreprises du monde entier. Compte tenu du volume croissant de données traitées quotidiennement, les entreprises doivent mettre en œuvre des mesures de sécurité solides pour protéger les informations sensibles. Les répercussions d’un manquement à cette règle peuvent Read more…

Digital & Data : nos conseils pour trouver des missions

La crise sanitaire mondiale l’a démontré : les métiers du digital & data tiennent une place prépondérante dans l’univers du travail. Le digital manager est responsable de l’e-réputation et de la notoriété numérique d’une entreprise. Il travaille avec la direction marketing et communication, et accompagne la direction dans l’établissement d’une Read more…

Les meilleurs assistants pour les programmeurs. Quels sont les programmes qui vous aideront à programmer ?

Découvrez les outils d’assistance essentiels pour maximiser votre productivité en programmation. Optimisez votre workflow avec les meilleures ressources du métier. Dans le monde actuel où le digital est au coeur de tout les business, il est primordial de pouvoir être compétifs et productifs sur ce secteur en constante évolution. C’est Read more…

Data Engineer – Fiche Métier : Missions, salaire, formation

Vous souhaitez vous orienter vers les métiers de la Data ?  Vous souhaitez devenir Data Engineer ? Le moment est approprié pour vous lancer, car c’est la data qui alimente toute les activités de nos société numérique actuelle ; par exemple : la régie publicitaire est de plus en plus basée sur la Read more…

developeur iOS

Compétences et connaissances nécessaires pour un développeur iOS débutant

Le métier de développeur fullstack ou mobile sous iOS vous intéresse ? Par où commencer et quels sont les prérequis nécessaires pour commencer dans le développement mobile ? Toutes les directives se trouvent dans ce guide ! Lancé en 2007 pour l’iPhone de première génération, le système d’exploitation iOS s’est Read more…

Web Scraping : Un atout indispensable pour la collecte de données

Le web scraping encore appelé harvesting est le processus de collecte de données web de manière automatisée. Il est également appelé extraction de données Web. Ce système standard du web scraping est indispensable aux grandes entreprises pour la prise de décision stratégique. Par ailleurs, les principaux cas d’utilisation du scraping Read more…

git-push

Comment gérer les dépôts distants avec Git push ?

Le Big Data, le DevOps et la plupart des domaines de l’informatique nécessitent un travail d’équipe. Et lorsqu’il s’agit de travail d’équipe, cela implique également d’utiliser un répertoire partagé. L’outil le plus commun permettant à tous les collaborateurs de réunir les tâches effectuées est Git. Pour rappel, Git est un Read more…

git

Maîtrisez le développement collaboratif de logiciel avec Git

Le phénomène Big Data a entraîné la production d’une quantité astronomique de données. Le traitement de ces informations est crucial pour que l’entreprise puisse en tirer profit lors de la prise de décision. Cependant, ce traitement nécessite l’intervention de plusieurs personnes telle que les Data Engineer, les Data Scientist, etc. Read more…

Comment créer un CV pour un poste de big data analyst ?

Des données, des données, toujours plus de données… La multiplication de l’activité numérique des entreprises ainsi que la place sans précédent qu’occupent les réseaux sociaux permettent d’accumuler de très grandes quantités d’informations que vous, en tant que big data analyst, êtes à-même de rassembler et d’interpréter au mieux. Pour faire Read more…

spring-java

Programmation en Spring Java : le guide complet

Le monde du Big Data et la programmation informatique sont quasi indissociables. En effet, le traitement des données volumineux requiert un minimum de compétences en programmation. De ce fait, il est important de connaître et de maîtriser quelques langages de programmation. Hormis Scala, qui domine en partie le développement Big Read more…

intelligence artificielle et big data

Big Data & intelligence artificielle : les robots vont-ils détruire nos emplois ?

Dans l’économie industrielle, les biens et services étaient produits par combinaison de la main d’œuvre et du capital. Cependant, l’innovation technologique, l’avancé dans le domaine de l’intelligence artificielle et l’automatisation des tâches par les robots a entraîné un déclin de la part de la main d’œuvre dans la fabrication des Read more…

switch java

Switch/Case : gérer les expressions conditionnelles en Java

En programmation informatique, les structures conditionnelles sont fondamentales pour implémenter la logique métier dans vos applications. Ces instructions vous permettent d’indiquer des conditions ou des embranchements d’exécution dans vos programmes informatiques. La plus connue d’entre elles est la structure if/else. Java, en tant que langage orienté objet, dispose de plusieurs Read more…

arraylist java

ArrayList : Apprenez à manipuler la collection multidimensionnelle de Java

Java dispose de plusieurs structures et collections de données. L’ensemble de ces collections se trouvent dans le package Java.util.Map. Les 3 grandes catégories de ces collections sont bien connues, ce sont : le Map, le HashMap, et le TreeMap. Dans le tutoriel hasmap de Java, nous vous avons expliqué comment Read more…

Cybersécurité & Big Data : comprendre l’intérêt et les limites du SIEM

Dans la chronique précédente de cette série sur la cybersécurité et le Big Data, nous avons expliqué que la cybersécurité fournit une vision du niveau d’exposition d’une entreprise à une attaque, en s’appuyant sur les données internes du Système d’Information de l’entreprise. Dans la même chronique, nous vous avons également Read more…

Cybersécurité et Big Data : utiliser les données pour déjouer les cyber-attaques

Pour continuer à assurer des niveaux de productivité croissants qui leur permettront de faire face aux challenges posés par la nouvelle économie d’aujourd’hui, les entreprises ont compris qu’elles devaient communiquer, communiquer d‘une part en interne avec ses différents collaborateurs et communiquer d’autre part en externe avec ses fournisseurs. Cette ouverture Read more…

cloudera vs hortonworks vs mapr

Cloudera CDH vs Hortonworks HDP vs MapR CDP : 5 critères pour choisir votre distribution Hadoop

En juillet 2014 dernier,  l’ex ministre Arnaud MONTEBOURG présentait les 34 plans de la Nouvelle France Industrielle (NFI), un projet de ré industrialisation  dont l’ambition est de  positionner la France stratégiquement sur  le Big Data. Par ce projet, l’Etat montre officiellement que malgré l’engouement médiatique qu’il y’a autour du Big Read more…

data hub

Qu’est ce qu’un Data Hub ? Définition du Hub de données

La valorisation réussie des données repose sur la stratégie de gestion de données définie en amont lors de la conception du système informatique de l’entreprise. Il est d’ailleurs de coutume dans le milieu de dire « Big Data without Analytics is just data », en d’autres termes : Le « Big » Data sans l’analyse Read more…

Encapsulation – POO : Qu’est ce que c’est ?

Le troisième principe fondamental de la programmation orientée objet c’est l’encapsulation. Dans cet article, nous allons vous expliquer en profondeur ce que c’est que l’encapsulation, à quoi il sert et pourquoi il est si important dans le paradigme orienté objet. Les propriétés des objets ne peuvent être accédées que par Read more…

developpeur-full-stack-metier

Développeur full stack : fiche métier (salaire, missions, compétences …)

Vous souhaitez travailler dans le domaine de l’informatique ? Vous voulez devenir développeur informatique, mais vous ne savez pas vers quel type de développement s’orienter ? Pourquoi ne pas devenir développeur full stack ?  C’est une bonne alternative si vous n’arrivez pas à choisir entre devenir développeur back-end ou front-end. La digitalisation de Read more…

selenium python

Selenium Python : réussir ses tests unitaires et extractions de données

La sécurité est un enjeu majeur des technologies numériques modernes. Avec le développement d’Internet et de la notion du partage en général, de nombreuses données circulent chaque jour sur les réseaux interconnectés et spécialement sur les sites web. Certains sites web peuvent contenir une très grande quantité d’informations ou de Read more…

Déployer Hadoop dans le Cloud

L’économie Numérique, grâce à la baisse des coûts des infrastructures informatiques qui la caractérise a permis l’émergence d’un nouveau type de modèle économique : le Cloud Computing. Grâce au Cloud Computing, les entreprises, aussi bien petites que grandes, qui n’avaient pas le budget nécessaire pour déployer un cluster Hadoop en production, ont désormais l’opportunité de l’acquérir sur la base d’un coût variable. Dans cette chronique, nous vous expliquerons comment Hadoop est utilisé dans le Cloud pour favoriser son adoption en entreprise.

Data Lake

Du Data Warehouse au Data Lake : quelle solution pour le stockage de données en Big Data ?

Nombreux sont les professionnels de la data qui se posent les questions sur la différence entre le Data Lake et le Data Warehouse. Certains ne saisissent pas  le sens ni l’utilisation de ces deux notions dans le stockage de données en Big Data.  Dans cette chronique, nous allons définir le Read more…

BeautifulSoup

Scrapez automatiquement n’importe quel site web avec BeautifulSoup

Les données sont devenues le carburant de la croissance des entreprises au cours de la dernière décennie. L’internet est la principale source de données, avec 5 milliards d’utilisateurs générant des milliards de points de données chaque seconde, ce qui constitue le Big Data. L’analyse des données web peut aider les Read more…

JupyterLab : Présentation de l’interface UI Notebook de Python

Dans un projet Big Data, plusieurs intervenants collaborent afin d’utiliser les multitudes de données traitées par ces derniers lors de la prise de décision de l’entreprise. Les Data Engineers, les Data Scientists et les Data Analysts font partie de ces personnes. Chacun d’eux possède des tâches spécifiques à exécuter. Cependant, Read more…

Comprendre et construire une courbe de Gauss en Python

La distribution gaussienne est la distribution de probabilité la plus importante en statistique. Elle l’est dans le domaine de la data science. En effet, de nombreux phénomènes naturels tels que la taille d’une population, la pression artérielle, la taille des chaussures, les statistiques scolaires comme les résultats aux examens, et Read more…

anaconda python

Installer et paramétrer un environnement Anaconda pour Python

Les données et les informations fusent partout grâce à la numérisation de tous les secteurs d’activité. Le domaine du Big Data est plus que jamais d’actualité et les entreprises s’intéressent de plus en plus aux avantages que peuvent leur apporter cette mine d’informations à leur prise de décision. Toutefois, avant Read more…

kmeans

K-Means : fonctionnement et utilisation dans un projet de clustering

Dans le monde d’aujourd’hui, la mise en œuvre des modèles d’apprentissage automatique est de plus en plus effectuée dans les entreprises pour la segmentation des clients et la détection des anomalies. Et si vous souhaitez devenir Data Scientist ou tout autre métier de la data, il devient primordial d’avoir des Read more…

apache-kafka

Apache Kafka – mode de fonctionnement

Pour réussir à ingérer les données en flux continu et les délivrer efficacement dans le Data Lake, les outils d’ingestion s’appuient sur deux éléments particuliers : une structure de données particulière appelée le Log ou bus d’événements et un système de messagerie Publish/Subscribe. Kafka et le Data Lake à la rescousse du streaming Le Data Lake/Data Read more…

cluster informatique

Cluster Informatique : l’infrastructure de base du Big Data

Avec les challenges dont on fait face dans l’ère du Numérique, la meilleure stratégie pour valoriser les données massives ne consiste plus à centraliser le stockage et le traitement des données sur un serveur [aussi puissant soit-il], mais à distribuer leur stockage et à paralléliser leur traitement sur plusieurs « nœuds » Read more…

numpy python

Maîtrisez l’analyse des données avec NumPy Python

Vous souhaitez devenir Data Analyst  ou Data Scientist ? Vous voulez faire des analyses de données avec python ? Ou vous souhaitez utiliser Python pour trouver des solutions à quelques problèmes du monde réel ? Alors, sachez que NumPy de Python est l’une des bibliothèques que vous devez connaître et utiliser si Read more…

boite-a-moustache-boxplot

Visualiser ses données avec une boîte à moustache | Boxplot

La compréhension des ensembles de données est essentielle à la démarche scientifique et au Big Data. Cependant, discerner la signification des données en ne regardant que leurs valeurs est une tâche difficile. Les statistiques descriptives sont des moyens rapides et concis d’extraire les caractéristiques importantes d’un ensemble de données en Read more…

hadoop mapreduce

Exécuter le MapReduce dans un cluster Hadoop

Pour valoriser le volume astronomique de données générées dans l’ère du Big Data, la meilleure stratégie consiste à distribuer le stockage de données et à paralléliser leur traitement dans un cluster d’ordinateurs.  Dit comme cela, c’est très facile à appréhender, cependant la réalité est tout autre ! Car valoriser les données Read more…

programmation python

Apprendre la programmation Python pour la data

Peut-être vous le savez déjà, mais les 2 langages compilés qui sont les plus adaptés dans le développement d’applications Big Data aujourd’hui sont Java et scala. Aujourd’hui, votre carrière dans le Big Data serait handicapée si vous n’avez pas un certain niveau de connaissance sur ces 2 langages.  En réalité, Java et Scala sont adaptés Read more…

Scikit-Learn : guide de démarrage rapide en Machine Learning avec Python

Les véhicules autonomes, la prédiction des prix, la détection de fraudes, la reconnaissance vocale, le diagnostic médical sont autant de domaine dans lesquels la modélisation prédictive apporte une grande valeur. Avec la disponibilité du volume de données apportée par la révolution du Big Data,  il est aujourd’hui possible de construire Read more…

Apache Airflow : déployer automatiquement des projets Big Data en production

Les informations à collecter et à stocker sont de plus en plus nombreuses. L’énorme flux de données qui affluent de nos jours favorise l’émergence de nouveaux outils. Parmi eux figurent Apache Airflow. Dans l’écosystème de technologies Big Data, Apache Airflow tout comme Oozie, est l’orchestrateur et le planificateur automatique des Read more…

Maitrisez Spark SQL pour l’ingénierie des bases de données

De nombreux data scientists, data analysts, data engineers et utilisateurs de Business Intelligence s’appuient sur des requêtes SQL interactives pour explorer les données. Spark SQL est un module d’Apache Spark pour le traitement de données structurées. Spark SQL fournit une abstraction de programmation appelée DataFrame et peut agir comme un Read more…

pyspark

Introduction à l’ingénierie des données massives avec PySpark

Internet, l’apparition de la 3G, 4G et actuellement de la 5G, les grandes installations scientifiques génèrent une immensité de données traitables. En 2020 une analyse a révélé que 40 zéctaoctets sont générés par an, 204 millions d’e-mails sont envoyés chaque minute. L’ensemble de ces données ainsi que les enjeux qui Read more…

programmation objet

Apprendre la programmation orientée objet par la pratique

Vous souhaitez apprendre à développer des applications informatiques ? Vous souhaitez développer des applications de données ? Alors vous devez impérativement apprendre la programmation orientée objet. Pour développer applications de traitement de données performantes (que ce soit des applications de base de données, des middleware, des applications de reporting, etc…), Read more…

reconversion informatique

Comment réussir sa reconversion professionnelle en informatique ?

Vous en avez marre de la routine professionnelle ? Vous êtes épuisés de toujours faire la même chose ? Vous Souhaitez changer de métier ? Vous désirez vous reconvertir en informatique ? Vous êtes au bon endroit ! De nos jours le numérique est d’une importance capitale et l’informatique fait désormais partie des Read more…

consultant amoa

Consultant AMOA Big Data – fiche métier : missions, formations, salaire

Vous êtes passionnés par les métiers de la Data ? Vous souhaitez travailler dans la maîtrise d’ouvrage ? Excellente nouvelle ! Nombreux, sont les choix qui vous sont offerts. Vous pouvez vous orienter en tant que consultant AMOA spécialisé dans le Big Data. Cette chronique est une fiche métier dans laquelle Read more…

métier data analyst

Data Analyst – Fiche Métier : Salaire, compétences, formation, emploi

Vous souhaitez vous orienter vers un métier de la Data ?  Vous souhaitez devenir Data Analyst ? Tout comme pour les métiers de Data Engineer, Data Scientist ou encore Data Architect, le moment est approprié pour vous lancer, car la data est au centre de toutes les activités de l’ère numérique. Read more…

programmation fonctionnelle

Apprendre la programmation fonctionnelle pour le Big Data

Développer des applications Big Data requiert la maîtrise du paradigme de programmation fonctionnelle. La programmation informatique classique n’est pas suffisante, car lorsqu’on veut traiter les données à large échelle dans un cluster, on fait face à des contraintes qui ne peuvent pas être résolues à l’aide des simples outils de Read more…

HBase : Développez des applications NoSQL – Tutoriel complet

citation Tutoriel HBase :     « Faire du NoSQL c’est juste faire des choix intelligents » Avec toute la volumétrie des données dont on dispose aujourd’hui et toutes leurs caractéristiques, c’est impossible de penser « Gestion de données » tel qu’on l’a fait dans le passé, c’est-à-dire centraliser le stockage Read more…

data visualisation

Informatique Décisionnelle : le guide complet

Il y’a aujourd’hui énormément d’informations fragmentées, et incomplètes dans le champs de l’informatique décisionnelle. Et pourtant, en tant que source du Big Data, l’informatique décisionnelle est la discipline d’où part le traitement informatisé des données. Dans cette chronique complète, nous allons expliquer de A à Z ce que c’est que Read more…

pandas python

Maîtrisez l’analyse des données avec Pandas Python

Vous souhaitez mener des analyses de données avec Python ? Panda Python vous évoque quelque chose ? Il faut savoir que la tâche principale attendue pour les Data Analysts ou les Business Analysts en entreprise est l’analyse de données. Cela implique notamment, le croisement de données à large échelle, l’uniformisation Read more…

busines analyst

Business Analyst – Fiche métier : missions, salaire, responsabilités

L’apparition des nouvelles technologies et l’explosion du volume de données ont suscité l’importance du métier de Business Analyst. Le Business Analyst, ou en français «Analyste d’Affaires» travaille au cœur de la direction financière d’une entreprise. Il est l’interlocuteur privilégié des décideurs de l’entreprise, et est au cœur de toutes les décisions prises par le pôle Read more…

programmation informatique

Apprendre à coder : le guide ultime de la programmation informatique

Dans le siècle précédent, on considérait comme illettrés, les personnes qui ne savaient ni lire, ni écrire. Aujourd’hui, dans le monde numérique où nous vivons, il est admis que les illettrés de ce siècle sont ceux qui ne savent pas programmer. Pourquoi ? Simplement parce que les activités du numériques Read more…

Définition du Data center : qu’est ce qu’un centre de données ?

Un data center est une expression anglaise qui signifie « centre de données » ou centre informatique plus vulgairement. C’est un lieu physique regroupant les équipements du système informatique d’une entreprise tels que : les ordinateurs, les serveurs, le stockage redondant RAID, les équipements réseaux et télécommunications, etc. Dans le cadre du Big Read more…

Data Manager – Fiche métier : compétences, formations, salaire

De nos jours, où le digital est devenu notre quotidien, la majorité des modèles économiques s’appuient sur la valorisation des données. En effet, avec le temps, de nombreuses entreprises ont accumulé tout un vaste actif de données et ont besoin d’un professionnel spécialisé dans la gestion de ces données, et Read more…

big data définition

Qu’est ce que le Big Data ? Définition complète

Le 21ème siècle a été témoin d’une explosion sans précédent du volume de données. D’après le constat des experts, des institutions publiques et privés, 90 % des données récoltées depuis le début de l’humanité ont été générées durant les 2 dernières années. Le marché qualifie  aujourd’hui de « Big Data » cette Read more…

dataiku

Le Self-Service Big Data avec Dataiku

​Ce​tte chronique est un livre blanc qui présente notre retour d’expérience sur l’outil Dataiku que nous avons utilisé lors de la réalisation d’un Poc of Hypothesis (Preuve d’Hypothèse – qui est un projet dans lequel on souhaite infirmer ou confirmer la faisabilité technique d’un ensemble d’idées).  Il a pour ambition Read more…

consultant informatique

Consultant informatique – fiche métier : compétences, formation, Salaire

Vous souhaitez vous orienter vers le métier de consultant informatique ? Vous êtes au bon endroit ! L’informatique fait partie des métiers les plus demandés et rentables de notre ère. Les grandes entreprises recherchent à chaque instant des spécialistes en informatique, en conseil, … car leur intervention est devenue indispensable Read more…

Déployer la stack ELK pour valoriser les logs de Cybersécurité

Dans la chronique précédente de cette série sur le développement d’une solution de cybersécurité à l’aide du Big Data, nous avons parlé intensément des SIEM. Comme vous l’avez vu, les architectures des solutions SIEM s’appuient sur 3 grands composants : un composant de collection de logs, un composant d’archivage de ces Read more…

sql_join

Comment effectuer une jointure de tables dans une base de données avec la clause SQL JOIN ?

En SQL, pour bénéficier de la puissance d’un système de gestion de base de données, il faut parfois combiner différentes tables de données afin d’obtenir un résultat. Pour effectuer cette combinaison, il faut faire de la jointure à l’aide des commandes SQL JOIN. Dans cet article, vous allez découvrir comment Read more…

sql_order_by

Comment trier efficacement une base de données avec SQL ORDER BY ?

Lorsque l’on dispose de plusieurs milliers ou même des millions de données, il est important de se retrouver une fois qu’on les sollicite ou qu’on les affiche. Trier les données selon une ou plusieurs critères spécifiques est nécessaire afin d’obtenir des résultats clairs et concis. La commande SQL ORDER BY Read more…

update_sql

Comment mettre à jour ou modifier des enregistrements dans une BD via SQL UPDATE ?

Modifier des données stockées dans une base de données est nécessaire afin de rectifier les informations et ainsi détenir des bases fiables. La commande SQL UPDATE est celle qui permet d’effectuer cela sur un système de gestion de base de données relationnel. Dans cet article, nous allons découvrir les différentes Read more…

sql_delete

Comment supprimer des enregistrements dans une base de données avec la clause SQL DELETE ?

Pour poursuivre notre série d’articles sur le langage SQL, nous allons cette fois-ci aborder la clause SQL DELETE. SQL permet d’interagir avec un système de gestion de bases de données. Mais outre le fait qu’il sert à insérer et mettre à jour des informations, il sert également à supprimer celles Read more…

docker

Persister des données dans un conteneur avec Docker volume

Nous continuons notre série d’articles et de tutoriels Docker avec cet article et dans celui-ci nous allons aborder le Docker volume. Lorsque l’on exécute une application, qu’elle soit conteneurisée ou non, on génère souvent des données. Ces dernières sont en général utiles lors des prochaines exécutions, ce qui veut dire Read more…

consultant business intelligence

Consultant Business Intelligence – fiche métier : salaire, formation, missions

La transformation numérique de la société, accentuée avec la pandémie du covid-19, a forcé les entreprises à exploiter la donnée pour améliorer leur performance. Désormais, la viabilité de la majorité des modèles économiques de notre époque dépend de l’exploitation intelligente de la donnée. Vous souhaitez vous orienter vers un métier Read more…

sql-between

Maîtrisez l’opérateur de comparaison SQL BETWEEN de A à Z

Dans nos précédents articles sur le langage SQL, nous avons déjà évoqué les conditions. Et dans celui-ci encore, nous allons parler de ce sujet, mais on va plutôt s’orienter vers les opérateurs que l’on peut inclure dans une condition. Celui qui nous intéresse aujourd’hui est BETWEEN. C’est un opérateur logique Read more…

sql-distinct

Maîtrisez le tri efficace de données en SQL et la gestion des doublons grâce à SQL DISTINCT

Lorsque l’on récupère des données dans une base de données SQL, on utilise l’instruction SELECT. Cependant, outre cette commande de base, celle-ci doit être associée à d’autres instructions afin d’obtenir des résultats précis. Le mot-clé SQL DISTINCT est utilisé avec SELECT dans le but d’éliminer les doublons et ainsi d’obtenir Read more…

sql-max

Comment déterminer la valeur max d’une table via la fonction SQL MAX ?

Nous continuons dans notre série d’articles sur le langage SQL et cette fois-ci, nous allons découvrir une fonction. En SQL, pour trouver la valeur maximale dans une colonne de donnée de type numérique ou alphanumérique, il faut utiliser la fonction d’agrégation SQL MAX (). On peut s’en servir, par exemple, pour Read more…

case sql

Rédigez des requêtes SQL intelligentes grâce au SQL CASE

Suite à notre article sur le langage SQL dans lequel nous avons montré l’importance et l’utilisation de ce dernier, nous avons entamé une série d’articles détaillant ses fonctionnalités. Dans cet article, nous allons vous apprendre à rédiger des requêtes SQL intelligentes avec SQL CASE. Soumettre des conditions est essentiel lorsque Read more…

>