Hadoop - 1.Hadoop 的运行环境介绍

hadoop 主要有三种运行模式:

> [单机模式]
> [伪分布模式]
> [完全分布模式]

单机模式

其中在单机模式下所有 3 个 XML 文件均为空,当配置文件为空时,Hadoop 会完全运行在本地,因为不需要与其他节点交互,单机模式就不使用 HDFS,也不加载任何 Hadoop 的守护进程。该模式主要用于开发调试 MapReduce 程序的应用逻辑。

伪分布式模式

在伪分布式模式下是指在“单节点集群”上运行 Hadoop,其中所有的守护进程都运行在同一台机器上,即 Jobtracker、Tasktracker、Namenode、Datanode、Secondarynamenode 进程都运行在同一台主机上。该模式在单机模式之上增加了代码调试功能,允许你检查内存使用情况,HDFS 输入输出,以及其他的守护进程交互。

完全分布式模式

是将 hadoop 运行在了一个真正的集群上,该集群内含有一个主节点 master,及至少两个的从节点 slave;其中主节点上主要运行 Namenode、Jobtracker、Secondarynamenode 进程,从节点主要运行 Datanode、Tasketracker 进程。这种模式下可以真正实现 hadoop 的分布式处理,有主节点对从节点的任务分配调度以及 HDFS 在主机间的输入输出。