dimanche 29 janvier 2017

Apache Oozie


Apache Oozie est un système de planification de workflow basé sur serveur pour gérer les jobs Hadoop.

Les flux de travail à Oozie sont définis comme une collection de noeuds de flux de contrôle et d'action dans un graphe acyclique dirigé. Les nœuds de flux de contrôle définissent le début et la fin d'un workflow (nœuds de début, de fin et de défaillance) ainsi qu'un mécanisme permettant de contrôler le chemin d'exécution du workflow (noeuds décision, fork et join). Les nœuds d'action sont le mécanisme par lequel un workflow déclenche l'exécution d'une tâche de calcul / traitement. Oozie prend en charge différents types d'actions, notamment Hadoop MapReduce, Hadoop distribué système de fichiers de fonctionnement, Pig, SSH et e-mail. Oozie peut également être étendu pour prendre en charge d'autres types d'actions.

Les flux de travail Oozie peuvent être paramétrés à l'aide de variables telles que $ {inputDir} dans la définition de workflow. Lors de la soumission d'une tâche de workflow, les valeurs des paramètres doivent être fournies. Si correctement paramétré (en utilisant différents répertoires de sortie), plusieurs travaux de workflow identiques peuvent s'exécuter simultanément.

Oozie est implémenté comme une application web Java qui s'exécute dans un conteneur de servlets Java et est distribué sous la licence Apache 2.0.

Author:

Related Posts:

  • Apache Flume Apache Flume est un service distribué, fiable et disponible pour collecter, regrouper et déplace… Read More
  • MapReduce MapReduce est un modèle de programmation et une implémentation associée pour le traitement et la gén… Read More
  • Apache Hive Apache Hive est une infrastructure d'entrepôt de données construite sur le dessus de Hadoop pour f… Read More
  • HBase HBase est une base de données open source, non relationnelle, distribuée basée sur le modèle BigTab… Read More
  • MongoDB MongoDB est un programme de base de données libre et open source multi-plateforme orienté docume… Read More
  • Zookeeper Zookeeper I propose to spend a little time together to discover Zookeeper which is regularly found … Read More
  • Apache Pig Apache Pig est une plate-forme de haut niveau pour la création de programmes exécutés sur Apache Ha… Read More
  • apache avro Avro est un appel de procédure à distance et une structure de sérialisation de données développée … Read More

0 commentaires: