hadoop pid路径重置

正常来说 hadoop的pid 是默认放在 linux 的 /tmp 目录中,而tmp 目录需要经常清理,假如集群长时间 运行,一旦重启就会发生 DataNode无法找到NameNode的诡异情况,这种主要是是hadoop 五个后台进程的pid 都在在 /tmp目录,为了 防止出现这些,我们把pid 的默认放置目录改了就可以了,怎么修改呢,这个 pid 声明是放在了 hadoop 根目录下的 etc/hadoop/目录下的
hadoop-env.sh 中
export HADOOP_PID_DIR=/usr/local/hadoop-2.8.1/pidData
和 mapred-env.sh
export HADOOP_MAPRED_PID_DIR=/usr/local/hadoop-2.8.1/pidData

yarn-env.sh
export YARN_PID_DIR=/usr/local/hadoop-2.8.1/pidData

修改这些就可以了,并scp 到所有的节点
然后在 hadoop的根目录下 创建 pidData 目录
,重新修改权限,重启集群即可

参考 https://www.cnblogs.com/hxsyl/p/6212333.html

推荐阅读更多精彩内容