04、Hadoop 读文件

本文详细解析了HDFS读取文件的完整流程,包括客户端如何向NameNode发起请求、获取数据块位置信息,以及如何从DataNode或复制节点中高效读取数据,涵盖HDFS架构、数据读取原理和容错机制。

HDFS – 读文件

 

1、 客户端向NameNode发送读取请求;
2、 NameNode#x8FD4;回文件的所有block和这些block所在的DataNodes(包括复制节点)
3、 客户端直接从DataNode中读取数据,如果该DataNode读取失败(DataNode失效或校验码不对),则从复制节点中读取(如果读取的数据就在本机,则直接读取,否则通过网络读取);