dimanche 29 janvier 2017

Sqoop

Sqoop est une application d'interface de ligne de commande pour le transfert de données entre les bases de données relationnelles et Hadoop. [1] Il prend en charge les charges incrémentielles...

Apache Oozie

Apache Oozie est un système de planification de workflow basé sur serveur pour gérer les jobs Hadoop. Les flux de travail à Oozie sont définis comme une collection de noeuds de...

Apache Kafka

Apache Kafka est une plate-forme de traitement de flux open-source développée par Apache Software Foundation écrit en Scala et Java. Le projet vise à fournir une plate-forme unifiée,...

Apache Velocity

Apache Velocity est un moteur de modèle basé sur Java qui fournit un langage de modèle pour référencer des objets définis dans le code Java. Il vise à assurer une séparation nette...
Apache Flume

Apache Flume

Apache Flume est un service distribué, fiable et disponible pour collecter, regrouper et déplacer efficacement de grandes quantités de données de journal. Il possède une architecture...

vendredi 27 janvier 2017

apache avro

apache avro

Avro est un appel de procédure à distance et une structure de sérialisation de données développée dans le projet Hadoop d'Apache. Il utilise JSON pour définir les types de données...

mardi 17 janvier 2017

Apache Hive

Apache Hive

Apache Hive est une infrastructure d'entrepôt de données construite sur le dessus de Hadoop pour fournir la synthèse des données, la requête et l'analyse.  Hive fournit une...