05、Hadoop 可靠性

本文深入解析HDFS(Hadoop分布式文件系统)的三大可靠性机制:DataNode失效检测与数据复制、数据完整性校验与自动修复,以及NameNode的单点故障问题与高可用方案,确保大数据存储的稳定与安全。

HDFS – 可靠性

1、 DataNode可以失效;

DataNode会定时发送心跳到NameNode如果*\#x5728;一段时间内NameNode没有收到DataNode的心跳消息则认为其失效此时NameNode就会将该节点的数据从该节点的复制节点中获取复制到另外的DataNode中

2、 数据可以毁坏;

无论是写入时还是硬盘本身的问题只要数据有问题读取时通过校验码来检测),都可以通过其他的复制节点读取同时还会再复制一份到健康的节点中

3、 NameNode不可靠;