YARN框架
原创大约 1 分钟
Hadoop通过HDFS实现了分布式存储,通过MapReduce实现了分布式计算,而计算任务的执行是通过YARN来完成的。

上面是Hadoop官方给出的YARN架构图,但省略了很多关键的信息和步骤。
总体来说,YARN中只有两个角色。
ResourceManager
:YARN集群主控节点,负责集群中所有应用程序的资源分配、协调和管理,其主要职责就是调度
,它并不关心每个应用程序的状态。NodeManager
:负责YARN集群节点上容器(Container)的监控和管理,追踪节点健康状况,管理日志等,与ResourceManager
保持通信,向ResourceManager
报告节点上资源的使用情况。
以一个完整的MapReduce计算任务为例,其整个运行过程如下图所示的那样。

看明白了这幅图,也就明白了YARN的作用。
所以,整个Hadoop其实就是三驾马车各司其职。
感谢支持
更多内容,请移步《超级个体》。