Hadoop教程
HBase
Hive
Pig
Sqoop
Spark

HBase 读取

必须在HFile,MemStore和BLOCKCACHE之间协调对HBase的读取。BlockCache旨在将来自HFile的频繁访问的数据保留在内存中,以避免磁盘读取。每个列族都有自己的BlockCache.BlockCache包含``块''形式的数据,作为HBase一次通过磁盘从磁盘读取的数据单元。这些街区。这意味着从HBase读取一个块只需要在索引中查找该块的位置,然后从磁盘中检索它。
块: 它是数据的最小索引单位,并且是可以从磁盘读取的最小数据单位。默认大小为64KB。
当首选较小的块时:执行随机查找。具有较小的块会创建较大的索引,从而消耗更多的内存。
当首选较大的块时:频繁执行顺序扫描。这样可以节省内存,因为较大的块意味着较少的索引条目,因此索引也较小。
要从HBase读取一行,首先需要检查MemStore,然后检查BlockCache,最后访问磁盘上的HFile。
昵称: 邮箱:
Copyright © 2022 立地货 All Rights Reserved.
备案号:京ICP备14037608号-4