登 录
注 册
< 大 数 据
Flink
Hadoop
Spark
Hive
HBase
Kafka
其他框架
Kerberos服务介绍与部署
Hadoop HA简介
HDFS手动故障转移
HDFS手动故障转移示例
HDFS自动故障转移
YARN自动故障转移
Hadoop白名单与扩容
HDFS存储优化-纠删码
HDFS冷热存储分离
HDFS慢磁盘监控
HDFS小文件归档
源码分析-NN启动(一)
源码分析-NN启动(二)
源码分析-NN启动(三)
热门推荐>>>
中台架构
中台建设与架构
HBase
HBased对接Hive
Linux
Nginx高可用
Python
数据导出工具
Flink
3分钟搭建Flink SQL测试环境
Kafka
Kafka对接Flume
深度学习
卷积神经网络
数据结构与算法
选择合适的算法
MySQL
数据备份恢复
计算机系统
信号量同步线程
Hive
Hive调优参数大全
其他框架
Azkaban Flow1.0与2.0
ClickHouse
表引擎-其他类型
技术成长
最好的职业建议
精选书单
技术成长书单—机器学习
技术资讯
数据在线:计算将成为公共服务
开发工具
IntelliJ IDEA 20年发展回顾(二)
系统工具
Mac命令行工具
虚拟化
内存虚拟化概述
云原生
云原生构建现代化应用
云服务
一文搞懂公有云、私有云...
Java
Spring Boot依赖注入与Runners
Go
Go函数与方法
SQL
SQL模板
安全常识
一文读懂SSO
当前位置:
首页
>>
Hadoop
>>
HDFS手动故障转移示例
HDFS手动故障转移示例
2020-07-03 13:51:11 星期五 阅读:1923
###HDFS手动转移示例 2020-07-03 13:50:08 星期五 ------------ ####当前集群NameNode状态 nn1:active nn2:standby 现在模拟nn1节点挂掉(把nn1的进程kill掉),如何恢复集群。 nn1挂掉后,如果直接把nn2切换为active(切换命令如下) ``` cd $HADOOP_HOME bin/hdfs haadmin -transitionToActive nn2 ``` 会报错拒绝连接,因为nn2连接不到nn1。也就是说如果nn2要切换为active状态,则需要与nn1通信,告诉nn1,我要切换了,你休息一会(这个机制是Hadoop用来防止集群脑裂的,如果连接不到nn1,并不代表nn1已经挂了,这时候如果冒然启动nn2,可能会导致集群有两个NameNode处于active状态,也就是脑裂) ####恢复步骤 启动挂掉的nn1节点 ``` # nn1节点操作 cd $HADOOP_HOME bin/hadoop-daemon.sh start namenode ``` 启动成功后,nn1会变为standby状态,nn2可以连接到nn1了。 切换nn2为active状态 ``` cd $HADOOP_HOME bin/hdfs haadmin -transitionToActive nn2 ``` 此时就可以切换成功了 结论:`要实现手动切换NameNode的active,要保证两台NameNode的进程都存在`