Comprendre et construire une courbe de Gauss en Python

La distribution gaussienne est la distribution de probabilité la plus importante en statistique. Elle l’est dans le domaine de la data science. En effet, de nombreux phénomènes naturels tels que la taille d’une population, la pression artérielle, la taille des chaussures, les statistiques scolaires comme les résultats aux examens, et Read more…

kmeans

K-Means : fonctionnement et utilisation dans un projet de clustering

Dans le monde d’aujourd’hui, la mise en œuvre des modèles d’apprentissage automatique est de plus en plus effectuée dans les entreprises pour la segmentation des clients et la détection des anomalies. Et si vous souhaitez devenir Data Scientist ou tout autre métier de la data, il devient primordial d’avoir des Read more…

boite-a-moustache-boxplot

Visualiser ses données avec une boîte à moustache | Boxplot

La compréhension des ensembles de données est essentielle à la démarche scientifique et au Big Data. Cependant, discerner la signification des données en ne regardant que leurs valeurs est une tâche difficile. Les statistiques descriptives sont des moyens rapides et concis d’extraire les caractéristiques importantes d’un ensemble de données en Read more…

Scikit-Learn : guide de démarrage rapide en Machine Learning avec Python

Les véhicules autonomes, la prédiction des prix, la détection de fraudes, la reconnaissance vocale, le diagnostic médical sont autant de domaine dans lesquels la modélisation prédictive apporte une grande valeur. Avec la disponibilité du volume de données apportée par la révolution du Big Data,  il est aujourd’hui possible de construire Read more…

>