集群启动

1 NameNode format

译为:格式化操作。

首次启动HDFS必须做的操作,本质上是初始化工作,进行HDFS清理和准备工作,如建立一些必要的工作目录和初始文件之类的。

hdfs namenode -format

敲击回车后,查看打印日志若含以下打印,则表示format成功:

storage directory /export/data/hadoop-3.1.4/dfs/name has been successfully formatted.

该目录在集群环境搭建修改配置文件的第2步配置过。

该操作在启动后,不可重复执行,会造成数据丢失,导致hdfs集群主从角色互不识别。

若已经重复执行了,只有删除所有机器的hadoop.tmp.dir目录,然后重新format。

2 启动角色

角色启动完成后可以用java命令jps查看角色进程(因为这些都是java程序)。

2.1 手动启动

可以每次手动执行命令来启动或关闭一个角色进程: 精准控制某台机器的某个角色。

  • HDFS集群
    ## start
    hdfs --daemon start namenode
    hdfs --daemon start datanode
    hdfs --daemon start secondarynamenode
    ## stop
    hdfs --daemon stop namenode
    hdfs --daemon stop datanode
    hdfs --daemon stop secondarynamenode
    
  • YARN集群
    ## start
    yarn --daemon start resourcemanager
    yarn --daemon start nodemanager
    ## stop
    yarn --daemon stop resourcemanager
    yarn --daemon stop nodemanager
    

2.2 脚本启动

sbin目录下有一键启动的脚本。

使用一键启动的脚本的前提:配置好机器之间的ssh免密登录和workers文件

  • hdfs集群
    • start-dfs.sh
    • stop-dfs.sh
  • yarn集群
    • start-yarn.sh
    • stop-yarn.sh
  • hadoop集群=hdfs+yarn
    • start-all.sh
    • stop-all.sh

2.3 启动错误

查看日志,在安装目录下的logs目录中。

2.4 web UI

hdfs集群http://namenodeHost:9870

namenodeHost: namenode所在机器的地址,即ip.

windows可以通过配置hosts文件,让ip与主机名对应,使用主机名进行访问。linux不用,可直接通过主机名。

yarn集群http://resourcemanagerHost:8088

resourcemanagerHost: resourcemanager所在机器的地址。

3 基准测试(benchmark)

又称:压力测试。

Copyright © qgao 2021-* all right reserved,powered by Gitbook该文件修订时间: 2022-04-26 11:52:34

results matching ""

    No results matching ""