HDFS上的文件对应的 Block保存多个副本,且提供容错机制,副本丢失或宕机自动恢复。默认存3份副本。
第一副本:放置在上传文件的 DataNode上;如果是集群外提交,则随机挑选台磁盘不太慢、CPU不太忙的节点
第二副本:放置在与第一个副本不同的机架的节点上
第三副本:与第二个副本相同机架的不同节点上。
如果还有更多的副本:随机放在节点中。
在HBase中,Store是指存储Region的数据的组件。每个Region都包含一个或多个Store,每个Store负责存储一个列族的数据。