selenium python

Selenium Python : réussir ses tests unitaires et extractions de données

La sécurité est un enjeu majeur des technologies numériques modernes. Avec le développement d’Internet et de la notion du partage en général, de nombreuses données circulent chaque jour sur les réseaux interconnectés et spécialement sur les sites web. Certains sites web peuvent contenir une très grande quantité d’informations ou de […]

Comprendre et construire une courbe de Gauss en Python

La distribution gaussienne est la distribution de probabilité la plus importante en statistique. Elle l’est dans le domaine de la data science. En effet, de nombreux phénomènes naturels tels que la taille d’une population, la pression artérielle, la taille des chaussures, les statistiques scolaires comme les résultats aux examens, et […]

programmation python

Apprendre la programmation Python pour la data

Peut-être vous le savez déjà, mais les 2 langages compilés qui sont les plus adaptés dans le développement d’applications Big Data aujourd’hui sont Java et scala. Aujourd’hui, votre carrière dans le Big Data serait handicapée si vous n’avez pas un certain niveau de connaissance sur ces 2 langages.  En réalité, Java et Scala sont adaptés […]

Introduction au Machine Learning avec Python

Nous vivons à l’ère des données, qui profite d’une meilleure puissance de calcul des ordinateurs et de l’immensité des ressources de stockage. C’est de cela que nous faisons allusion lorsque nous parlons de Big Data. Ces données ou informations augmentent de jour en jour, mais le véritable défi consiste à […]

python try except

Comment gérer les exceptions en Python ?

Lorsqu’on développe un programme, que ce soit en Big Data ou pour tout autre utilisation, il y a toujours un risque que l’on génère des erreurs. Ces erreurs peuvent provenir de l’utilisateur de la solution ou bien de l’exécution du programme lui-même. Pour éliminer ou du moins limiter l’apparition de […]

La fonction map() de Python

La fonction map() intégrée à Python peut être utilisée pour exécuter une fonction à chaque élément d’une liste de données.  Elle donne comme résultat un objet map utilisable dans la suite du programme. Pour créer un iterable, vous pouvez passer l’objet map a une fonction list() ou autres types de fonction. […]

La fonction reduce() en Python

Avec la fonction reduce(), vous pouvez passer en argument une fonction particulière et pouvoir l’utiliser sur tous les éléments de la liste. C’est dans le module functools que se trouve la fonction reduce(). Voici la syntaxe de base de la fonction : Fonction reduce() avec 3 arguments En Python3, la […]

La fonction Filter() Python

Vous pouvez créer un nouvel itérateur à partir d’un itérateur existant comme une liste ou un dictionnaire et tout cela grâce à la fonction filter() intégré à Python.  Un iterable est un objet python qui peut être « itéré ». Cela veut dire qu’il renvoie des éléments dans une séquence utilisable dans une boucle […]

La fonction Sleep() Python

La fonction sleep() sert à stopper momentanément un thread (fil de tâche).  C’est le module time de Python qui fournit toutes les fonctions destinées à la gestion de temps dont le plus utilisé est la fonction sleep(). Voici la syntaxe de base de la fonction sleep() : Ici, ‘nombre’ est […]

Les meilleurs assistants pour les programmeurs. Quels sont les programmes qui vous aideront à programmer ?

Découvrez les outils d’assistance essentiels pour maximiser votre productivité en programmation. Optimisez votre workflow avec les meilleures ressources du métier. Dans le monde actuel où le digital est au coeur de tout les business, il est primordial de pouvoir être compétifs et productifs sur ce secteur en constante évolution. C’est […]

Comment créer un CV pour un poste de big data analyst ?

Des données, des données, toujours plus de données… La multiplication de l’activité numérique des entreprises ainsi que la place sans précédent qu’occupent les réseaux sociaux permettent d’accumuler de très grandes quantités d’informations que vous, en tant que big data analyst, êtes à-même de rassembler et d’interpréter au mieux. Pour faire […]

developpeur-full-stack-metier

Développeur full stack : fiche métier (salaire, missions, compétences …)

Vous souhaitez travailler dans le domaine de l’informatique ? Vous voulez devenir développeur informatique, mais vous ne savez pas vers quel type de développement s’orienter ? Pourquoi ne pas devenir développeur full stack ?  C’est une bonne alternative si vous n’arrivez pas à choisir entre devenir développeur back-end ou front-end. La digitalisation de […]

programmation objet

Apprendre la programmation orientée objet par la pratique

Vous souhaitez apprendre à développer des applications informatiques ? Vous souhaitez développer des applications de données ? Alors vous devez impérativement apprendre la programmation orientée objet. Pour développer applications de traitement de données performantes (que ce soit des applications de base de données, des middleware, des applications de reporting, etc…), […]

busines analyst

Business Analyst – Fiche métier : missions, salaire, responsabilités

L’apparition des nouvelles technologies et l’explosion du volume de données ont suscité l’importance du métier de Business Analyst. Le Business Analyst, ou en français «Analyste d’Affaires» travaille au cœur de la direction financière d’une entreprise. Il est l’interlocuteur privilégié des décideurs de l’entreprise, et est au cœur de toutes les décisions prises par le pôle […]

dataiku

Le Self-Service Big Data avec Dataiku

​Ce​tte chronique est un livre blanc qui présente notre retour d’expérience sur l’outil Dataiku que nous avons utilisé lors de la réalisation d’un Poc of Hypothesis (Preuve d’Hypothèse – qui est un projet dans lequel on souhaite infirmer ou confirmer la faisabilité technique d’un ensemble d’idées).  Il a pour ambition […]

logo Kubernetes

Maîtrisez le déploiement et l’orchestration des applications avec Kubernetes [Guide Complet]

Comme nous l’avons évoqué dans notre guide ultime sur Docker, la notion de conteneurisation est un concept très important, surtout si l’on travaille en tant qu’ingénieur DevOps/Cloud ou développeur Big Data. Toujours dans cette lignée, nous allons aujourd’hui vous parler d’un outil permettant d’optimiser le traitement des conteneurs à savoir […]

dockerfile

Créez vos propres images docker avec dockerfile

Si vous avez lu nos articles précédents, notamment notre guide ultime de Docker, vous savez maintenant qu’un conteneur est créé à partir d’une image Docker. On peut retrouver des milliers d’images sur Docker Hub, cependant, si l’on souhaite créer notre propre image ou apporter quelques modifications aux existantes, vous devez […]

LE SQL DANS HADOOP : Hive & Pig

La solution conceptuelle au problème de traitement de données dans l’ère Numérique est la suivante : les traitements/calculs doivent être divisés en tâches et leur exécution doit être parallélisée dans un cluster d’ordinateurs complètement tolérant aux pannes. La tolérance aux pannes est fournie par un tout nouveau type de Système […]

meilleurs masters big data

Top 10 des meilleurs Masters Big Data

Vous souhaitez vous [ré]orienter vers un métier du Big Data ? En particulier, vous souhaitez devenir Data Engineer ou Architecte Big Data ?  Vous recherchez une formation qui peut vous permettre d’acquérir les compétences nécessaires pour travailler dans ces métiers ? Alors, vous êtes au bon endroit.  Dans cet article, nous allons vous […]

data architecte

Big Data Architecte : Missions, rôle, formation et salaire

L’objectif ultime du « Big » Data, c’est l’information, l’extraction de l’information pertinente pour la prise de décision, ce que beaucoup qualifient par “valeur” ou “insights“. L’objectif du “Big” Data est l’information.  Malheureusement, malgré la disponibilité des technologies du Big Data, beaucoup d’entreprises et d’organisations ont encore du mal à obtenir l’information dont ils ont besoin. […]

bases de données SQL

Hadoop vs Teradata : les approches technologiques d’interrogation d’une base de données en Big Data

Vous travaillez sur des projets de reporting, Business Intelligence, Big Data et vous avez du mal avec vos requêtes ? Vos bases de données SQL prennent trop de temps pour s’exécuter ? Vos requêtes SQL sont trop lentes ? Dans cette chronique, nous vous expliquerons l’approche technologique utilisée pour interroger efficacement les bases de données

Prsentation formation Pipeline Streaming

Développez des Pipelines Streaming à large échelle Un programme hyper-pratique pour développer des pipelines streaming de bout-en-bout en moins de 3 mois !  Vous souhaitez travailler dans le Big Data en tant que Data Engineer?  Si c’est le cas, alors il vous faut être conscient d’une chose :  de plus […]

Presentation formation Pipeline Streaming

Développez des Pipelines Streaming à large échelle Un programme hyper-pratique pour développer des pipelines streaming de bout-en-bout en moins de 3 mois !  Vous souhaitez travailler dans le Big Data en tant que Data Engineer?  Si c’est le cas, alors il vous faut être conscient d’une chose :  de plus […]

Pig Latin

C’est le langage d’abstraction offert par Pig.  Il est à peu près similaire au langage de Scripting tels que Perl, Python, ou Ruby. Cependant, il est plus spécifique que ces derniers et se décrit mieux sur le terme « langage de flux de données » (data flow language). Il permet d’écrire des […]

Le Projet Data Transition Numerique

Vous souhaitez travailler dans le Big Data ? Vous souhaitez vous réorienter vers un parcours de Data Engineer rapidement ? Si vous avez répondu « oui » à cette question, alors vous êtes au bon endroit. Ce site est une sorte de « club Big Data », un lieu dans lequel vous pouvez sereinement progresser […]

>