什么是HBase
Hbase是基于Hadoop构建的开源和分类地图数据。它是面向列的并且可以水平扩展。
它基于Google的Big Table。它具有一组表,这些表以键值格式保存数据。 Hbase非常适合稀疏数据集,而稀疏数据集在大数据用例中非常常见。 Hbase提供了几乎可以使用任何编程语言进行开发的API。它是Hadoop生态系统的一部分,可提供对Hadoop文件系统中数据的随机实时读写访问。
为什么使用HBase
随着数据变大,RDBMS呈指数级下降
期望数据具有高度结构化的能力,即符合定义良好的架构的能力
架构中的任何更改都可能需要停机
对于稀疏数据集,维护NULL值的开销太大
Hbase的功能
可横向扩展: 您可以随时添加任意数量的列。
自动故障转移: 自动故障转移是一种资源,可让系统管理员在系统受到破坏时自动将数据处理切换到备用系统
与Map/Reduce框架的集成: 所有命令和Java代码在内部实现Map/Reduce以完成任务,并且基于Hadoop分布式文件系统构建。
稀疏,分布式,持久性,多维排序的地图,该地图由行键,列键和时间戳索引。
通常称为键值存储或面向列族的数据库,或存储版本化的地图。
从根本上讲,它是一个用于通过随机访问来存储和检索数据的平台。
不在乎数据类型(对于同一列,在一行中存储一个整数,在另一行中存储一个字符串)。
它不会在您的数据内建立关系。
它旨在运行在使用商品硬件构建的计算机集群上。