负载均衡问题:
数据的逻辑分布:即region划分/分布,是rowkey到region的映射问题数据的物理分布:即region在RS上的调度问题访问的分布:即系统吞吐(请求)在各个RS上的分布问题,涉及数据量和访问量之间的关系,访问热点等 。
HBase能够实现灵活调度、秒级扩容的关键
可见,一行数据的分布(找到一行数据所在的RS),存在2个层级的路由:一是rowkey到region的路由,二是region到RS的路由 。这一点是HBase能够实现灵活调度、秒级扩容的关键 。
逻辑分布 – 基于范围的划分
就是:一张表如何划分成多个region
region划分的粒度是行,region就是这个表中多个连续的行构成的集合 。行的唯一标识符是rowkey,所以,可以将region理解为一段连续分布的rowkey的集合 。所以,称这种方式为基于rowkey范围的划分 。一个region负责的rowkey范围是一个左闭右开区间,所以,后一个region的start key是前一个region的end key 。注意,第一个region是没有start key的,最后一个region是没有end key的 。这样,这个表的所有region加在一起就能覆盖任意的rowkey值域 。
一般来说,region的生成有3种方式:建表时进行预分区:通过对rowkey进行预估,预先划分好regionregion分裂:手工分裂,或达到一定条件时自动分裂(如region大小超过一个阈值)region合并:手工合并
所以,为了使表从一开始就具备良好的吞吐和性能,实际生产环境中建表通常都需要进行预分区 。但也有一些例外,比如无法预先对rowkey范围进行预估,或者,不容易对rowkey范围进行均匀的拆分,此时,也可以创建只有一个region的表,由系统自己分裂,从而逐渐形成一个“均匀的”region分布 。
- 有关爱护自然的作文600字 中国之最知识600字作文
- 为什么袁家中的女人大多都穿着红色的裤子?和袁世凯老婆太多有关
- 什么是努力,什么是坚持,有关坚持努力的作文素材
- 康熙传位于雍正是否与他特别喜欢乾隆有关?
- 3亿多中国人患这种病,近一半死亡与它有关!做好8件事,远离它 中国十大病
- 缅北恐怖事件,活埋,割腰子,来自逃生者的口述@抖音短视频 有关世界之最的短视频名称
- 中国孩子的小语种,世界的大语种:为啥大家都在学西语? 世界之最有关西语国家
- 历史揭秘:东汉和刘邦有关系吗?
- 慈禧为什么被称为老佛爷是因为与她拜佛有关吗
- 中国历史上的10大女子 有关历史女人之最的书