Hadoop – 简介
Hadoop可运行于一般的商用服务器上,具有高容错、高可靠性、高扩展性等特点
特别适合写一次,读多次的场景
适合
- 大规模数据
- 流式数据(写一次,读多次)
- 商用硬件(一般硬件)
不适合
- 低延时的数据访问
- 大量的小文件
- 频繁修改文件(基本就是写1次)
Hadoop架构

- HDFS: 分布式文件存储
- YARN: 分布式资源管理
- MapReduce: 分布式计算
- Others: 利用YARN的资源管理功能实现其他的数据处理方式
内部各个节点基本都是采用Master-Woker架构
本文全面介绍Hadoop分布式系统,包括其高容错、高扩展性特点,适合大规模数据与流式数据的场景,以及HDFS、YARN、MapReduce核心架构。深入分析Hadoop的适用与不适用场景,为大数据技术选型提供参考。
Hadoop可运行于一般的商用服务器上,具有高容错、高可靠性、高扩展性等特点
特别适合写一次,读多次的场景

内部各个节点基本都是采用Master-Woker架构