Hadoop Notebook
简介
1.
Hadoop简介
2.
HDFS
2.1.
写文件
2.2.
读文件
2.3.
可靠性
2.4.
可用性
2.5.
命令工具
3.
YARN
3.1.
ResourceManager
3.2.
NodeManager
3.3.
ApplicationMaster
3.4.
Container
3.5.
失败处理
4.
MapReduce
4.1.
读数据
4.2.
Map
4.3.
Shuffle
4.4.
Reduce
4.5.
编程
5.
IO
6.
测试
7.
安装
8.
配置
9.
监控
10.
参考
Powered by
GitBook
A
A
襯線體
無襯線體
白色
棕褐色
夜間
分享到 Twitter
分享到 Google
分享到 Facebook
分享到 Weibo
分享到 Instapaper
Hadoop Notebook
Hadoop - 简介
Hadoop可运行于一般的商用服务器上,具有高容错、高可靠性、高扩展性等特点
特别适合写一次,读多次的场景
适合
大规模数据
流式数据(写一次,读多次)
商用硬件(一般硬件)
不适合
低延时的数据访问
大量的小文件
频繁修改文件(基本就是写1次)
Hadoop架构
HDFS:
分布式文件存储
YARN:
分布式资源管理
MapReduce:
分布式计算
Others:
利用YARN的资源管理功能实现其他的数据处理方式
内部各个节点基本都是采用Master-Woker架构