MapReduce

Le MapReduce est un modèle algorithmique qui consiste à découper le traitement d’un fichier de données en tâches indépendantes en suivant 2 phases : une phase Map, une et une phase Reduce. L’utilisateur spécifie une fonction de hachage Map qui transforme les données d’entrée en paires de clés/valeurs, et une fonction de hachage Reduce qui agrège toutes les valeurs associées à la même clé. Une phase intermédiaire entre le Map et le Reduce appelée shuffle trie les paires de clés/valeurs générées par clé. Ce style de programme, écrit dans un style fonctionnel est automatiquement parallélisé et exécuté dans un cluster.

« Back to Glossary Index