Hadoop教程
HBase
Hive
Pig
Sqoop
Spark

什么是HBase

Hbase是基于Hadoop构建的开源和分类地图数据。它是面向列的并且可以水平扩展。
它基于Google的Big Table。它具有一组表,这些表以键值格式保存数据。 Hbase非常适合稀疏数据集,而稀疏数据集在大数据用例中非常常见。 Hbase提供了几乎可以使用任何编程语言进行开发的API。它是Hadoop生态系统的一部分,可提供对Hadoop文件系统中数据的随机实时读写访问。

为什么使用HBase

随着数据变大,RDBMS呈指数级下降 期望数据具有高度结构化的能力,即符合定义良好的架构的能力 架构中的任何更改都可能需要停机 对于稀疏数据集,维护NULL值的开销太大

Hbase的功能

可横向扩展: 您可以随时添加任意数量的列。 自动故障转移: 自动故障转移是一种资源,可让系统管理员在系统受到破坏时自动将数据处理切换到备用系统 与Map/Reduce框架的集成: 所有命令和Java代码在内部实现Map/Reduce以完成任务,并且基于Hadoop分布式文件系统构建。 稀疏,分布式,持久性,多维排序的地图,该地图由行键,列键和时间戳索引。 通常称为键值存储或面向列族的数据库,或存储版本化的地图。 从根本上讲,它是一个用于通过随机访问来存储和检索数据的平台。 不在乎数据类型(对于同一列,在一行中存储一个整数,在另一行中存储一个字符串)。 它不会在您的数据内建立关系。 它旨在运行在使用商品硬件构建的计算机集群上。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4