图标

891dfcff22fa14f5315589394e7efcc.png

image.png

image.png


HDFS副本机制

HDFS上的文件对应的 Block保存多个副本,且提供容错机制,副本丢失或宕机自动恢复。默认存3份副本。

副本放置策略

第一副本:放置在上传文件的 DataNode上;如果是集群外提交,则随机挑选台磁盘不太慢、CPU不太忙的节点

第二副本:放置在与第一个副本不同的机架的节点上

第三副本:与第二个副本相同机架的不同节点上。

如果还有更多的副本:随机放在节点中。


HBase的Store组件

在HBase中,Store是指存储Region的数据的组件。每个Region都包含一个或多个Store,每个Store负责存储一个列族的数据。


HBase的数据模型(四维数据坐标:行键、列族、列限定符、时间戳)

IMG_20241210_011056.jpg


关于Hbase具体数据索引