lundi 16 janvier 2017

HBase


HBase est une base de données open source, non relationnelle, distribuée basée sur le modèle BigTable de Google et écrite en Java. Il est développé dans le cadre du projet Apache Hadoop Apache Software Foundation et fonctionne sur le dessus de HDFS (Hadoop Distributed File System), fournissant BigTable-comme les capacités pour Hadoop. C'est-à-dire qu'il fournit une manière tolérante aux pannes de stocker de grandes quantités de données éparses (de petites quantités d'informations capturées au sein d'une grande collection de données vides ou sans importance, comme trouver les 50 plus gros éléments d'un groupe de 2 milliards d'enregistrements ou trouver Les éléments non nuls représentant moins de 0,1% d'une énorme collection).

HBase comporte la compression, l'opération en mémoire et les filtres Bloom sur une base par colonne comme indiqué dans le papier BigTable d'origine.  Les tables de HBase peuvent servir d'entrée et de sortie pour les travaux MapReduce exécutés dans Hadoop et peuvent être accessibles via l'API Java, mais également via les API de passerelle REST, Avro ou Thrift. HBase est un magasin de données de valeur-clé orienté colonne et a été idolized largement en raison de sa lignée avec Hadoop et HDFS. HBase fonctionne au sommet de HDFS et est bien adapté pour des opérations de lecture et d'écriture plus rapides sur de grands ensembles de données avec un débit élevé et une faible latence d'entrée / sortie.
HBase n'est pas un remplacement direct pour une base de données SQL classique, cependant le projet Apache Phoenix fournit une couche SQL pour HBase ainsi qu'un pilote JDBC qui peut être intégré à diverses applications d'analyse et de business intelligence. Le projet Apache Trafodion fournit un moteur de requête SQL avec des pilotes ODBC et JDBC et une protection de transaction ACID répartie entre plusieurs instructions, tables et lignes qui utilise HBase comme moteur de stockage.

HBase dessert maintenant plusieurs sites Web basés sur des données, dont la plate-forme de messagerie de Facebook [4] [5] Contrairement aux bases de données relationnelles et traditionnelles, HBase ne prend pas en charge les scripts SQL; L'équivalent est écrit en Java, en utilisant la similarité avec une application MapReduce.

Dans le langage du théorème CAP de Eric Brewer, HBase est un système de type CP.

Author:

Related Posts:

  • Apache Pig Apache Pig est une plate-forme de haut niveau pour la création de programmes exécutés sur Apache Ha… Read More
  • Zookeeper Zookeeper I propose to spend a little time together to discover Zookeeper which is regularly found … Read More
  • apache avro Avro est un appel de procédure à distance et une structure de sérialisation de données développée … Read More
  • MongoDB MongoDB est un programme de base de données libre et open source multi-plateforme orienté docume… Read More
  • Apache Hive Apache Hive est une infrastructure d'entrepôt de données construite sur le dessus de Hadoop pour f… Read More
  • HBase HBase est une base de données open source, non relationnelle, distribuée basée sur le modèle BigTab… Read More
  • MapReduce MapReduce est un modèle de programmation et une implémentation associée pour le traitement et la gén… Read More
  • Apache Flume Apache Flume est un service distribué, fiable et disponible pour collecter, regrouper et déplace… Read More

0 commentaires: