C’est le langage d’abstraction offert par Pig.  Il est à peu près similaire au langage de Scripting tels que Perl, Python, ou Ruby. Cependant, il est plus spécifique que ces derniers et se décrit mieux sur le terme « langage de flux de données » (data flow language). Il permet d’écrire des requêtes sous forme de flux séquentiels de données sous Hadoop à la façon d’un ETL (la notion d’ETL est développé dans notre ouvrage Big Data Streaming -lien). Ces flux sont ensuite transformés en fonctions MapReduce qui sont enfin soumises au cluster pour exécution.

« Back to Glossary Index
Categories:

Juvénal JVC

Juvénal est spécialisé depuis 2011 dans la valorisation à large échelle des données. Son but est d'aider les professionnels de la data à développer les compétences indispensables pour réussir dans le Big Data. Il travaille actuellement comme Lead Data Engineer auprès des grands comptes. Lorsqu'il n'est pas en voyage, Juvénal rédige des livres ou est en train de préparer la sortie d'un de  ses livres. Vous pouvez télécharger un extrait de son dernier livre en date ici : https://www.data-transitionnumerique.com/extrait-ecosystme-hadoop/

>