本文档为cdh集群,下线/上线节点操作文档。

CM 集群下线节点,主要参考官方文档:

  • 操作前调优文档: https://docs.cloudera.com/documentation/enterprise/6/latest/topics/cm_mc_decomm_host.html#concept_urw_wyw_cy
  • 操作文档:https://docs.cloudera.com/documentation/enterprise/6/latest/topics/cm_mc_host_maint.html#cm_mc_host_maint

具体步骤如下:

  1. 开始下线前的自检

    # 自检 hdfs 文件是否有损坏
    hdfs fsck / -list-corruptfileblocks -openforwrite -files -blocks -locations
    # 如果文件有损坏,需要进行修复
    hdfs fsck file_name -move
    
  2. 选择需要下线的主机,开始下线。为了避免下线过程中出现数据丢失的风险,一次下线的主机数量要小于 hdfs block 的副本数量

  3. 选择迁移时是否要同步迁移数据,一般时要选择同步迁移数据。然后开始下线节点

  4. 接着会显示节点下线的进度。同时在NameNode web ui 上会显示 hdfs block 文件向其他节点的同步进度(主要看 Number of Under-Replicated Blocks)。
    在 NameNode Summary 页面,可以看到正在下线的节点数量和待迁移的 hdfs block 数量。

  5. 下线结束后,可以去集群后台使用命令查看各个节点在迁移后的磁盘使用率

    hdfs dfsadmin -report
    

在下线过程中,可能存在以下情况:

  • 参数调优时,设置参数过大,同步速度快但是集群负载高,导致失败;
  • 网络波动导致 NameNode 主备切换,web界面显示下线过程结束了,但后台还在进行;
    这时会出现block还未迁移完的情况(Under-replicated blocks显示不为0),可以等hdfs自动修复(推荐),也可以手动修复(速度也很慢)。
    手动修复执行脚本如下:

    hdfs fsck / | grep 'Under replicated' | awk -F':' '{print $1}' >> /tmp/under_replicated_files
    然后循环修复:
    for hdfsfile in `cat /tmp/under_replicated_files`; do echo "Fixing $hdfsfile :" ;  hadoop fs -setrep 3 $hdfsfile; done
    
  1. 数据迁移完后,开始从CM上删除节点。先进行从集群中删除主机,然后进行Remove Hosts From Cloudera Manager,直接在对应的页面中使用默认选项确定即可,注意Remove Hosts From Cloudera Manager中需要先去下线节点上手动停止cm-agent:systemctl stop cloudera-scm-agent 然后直接点击确定即可,这里貌似也会解除授权角色,自动进行数据迁移到其他节点,但我没有这么操作过。

附录:
hdfs fsck 参数详解:
参数说明:

Total size : hdfs集群存储大小,不包括复本大小。

Total blocks (validated) : 总共的块数量,不包括复本。

Number of data-nodes : datanode的节点数量

Number of racks : 机架数量

Default replication factor : 默认的复制因子

Average block replication : 当前块的平均复制数,如果小 default replication factor,则有块丢失

Under-replicated blocks : 正在复制块数量,可采用 hadoop fsck -blocks 解决问题

Mis-replicated blocks : 正复制的缺少复制块的数量

Missing replicas : 缺少复制块的数量,通常情况下Under-replicated blocks\Mis-replicated blocks\Missing replicas 都为0,则集群健康,如果不为0,则缺失块了

Corrupt blocks : 坏块的数量,这个值不为0,则说明当前集群有不可恢复的块,即数据有丢失了

当下架节点时Under-replicated blocks\Mis-replicated blocks\Missing replicas,这三个参数会显示当前,需要补的块的数量,集群会自动补全,当三个参数都为0时,则集群块的复制块完全了。

CDH 使用 CM下线节点相关推荐

  1. ES平滑下线节点操作手册

    检查集群配置 将节点从集群路由策略中排除 等待所有分区与数据迁移完成 停掉节点服务进程 恢复集群路由策略 检查集群配置 在做节点下线操作之前,建议先检查 master-eligible 节点的数量与 ...

  2. Elasticsearch 平滑下线节点实践指南

    在 Elasticsearch 日常运维中,有时候要对集群的某一个节点进行下线.上线操作,比如增加磁盘,扩展内存,版本升级,或节点回收等.本文就根据近期的一次生产实践,梳理如何实现 Elasticse ...

  3. CDH、CM下载403,Cloudera收费无法下载解决,CDH安装包下载

    CDH下载 6.3.2 链接: https://pan.baidu.com/s/1e1LmRY7aHQSCMJq3Lz6DtA 密码: 1vje --来自百度网盘超级会员V6的分享 6.3.1 链接: ...

  4. Cloudera CDH离线安装增加节点到集群

    新增一台机器步骤: 设置所有集群的hosts一样,加入新增的机器 vim /etc/sysconfig/network 修改hostnmae为dw.node2 hostname dw.node2 cp ...

  5. CDH 配置CM Server的数据库时错误

    根据北京尚学堂视频学习安装,在配置CM Server数据库时 执行命令提示错误如下: ./scm_prepare_database.sh mysql temp -h cdh1 -utemp -ptem ...

  6. 安装CM 6.3.1和CDH 6.3.2

    安装CM 6.3.1和CDH 6.3.2 操作系统要求 在安装CDH之前,我们来看看平台对系统有什么样的要求.通过官方文档,我们可以看到有5个方面的要求: 软件依赖 CDH和CM支持的依赖 文件系统要 ...

  7. CM/CDH 问题记录

    本文档为使用 CDH 6.3.1 时,记录安装过程/使用中出现的一些问题,供后续备查. 从2021年1月31日开始,所有Cloudera软件都需要有效的订阅,并且只能通过付费进行访问.之前的在线安装, ...

  8. CDH安装及使用CM安装集成livy和zepplin

    首先转载几位大佬的几篇文章; CDH6.2.0搭建 https://blog.csdn.net/weixin_38201936/article/details/106006335 CDH6.2.0搭建 ...

  9. 【Hadoop】节点的上线、下线

    本章节主要介绍Hadoop运维管理中节点的上.下线 一.下线 运维过程中,遇到最多的就是某几个节点磁盘坏掉.磁盘满.机器宕机等情况导致某些任务执行失败,如果只是一个节点故障,并无大碍,因为一般任务有3 ...

最新文章

  1. YOLOv5实现自定义对象训练与OpenVINO部署全解析
  2. linux系统日志_第十二章:走进Linux世界——系统日志管理,日志轮转。
  3. DOCKER存储驱动之DEVICE MAPPER简介
  4. Unity MeshBaker 合并网格和材质
  5. 执行nvidia-smi出错
  6. java8 hashmap_Java8 中的 HashMap
  7. BP神经网络预测模型+粒子群算法优化的BP神经网络(PSO-BP)预测模型,基于Matlab
  8. SiamFC代码分析(architecture、training、test)
  9. Part Ⅵ Transportation 交通??
  10. LeetCode 热题 HOT 100 -------160. 相交链表(链表)206. 反转链表(递归、回溯)
  11. 解决 vmware 虚拟机安装后没有虚拟网卡问题
  12. 重返帝国T0阵容搭配
  13. 个人财务管理系统项目
  14. 在.net gridview 更新回oracle数据库,.net 连接Oracle操作 - cathy_10 - 博客园
  15. android 数据备份
  16. PostgreSQL 14分布式Citus单机多实例部署
  17. 【商业分析 01】商业分析网站汇总
  18. 红绿3d眼镜与红蓝3d眼镜区别_Rokid X 非白三维,AR眼镜 + 3D扫描
  19. LInux7系统支持华硕H81,华硕h81主板bios设置方法步骤
  20. 五、三层交换机配置服务器

热门文章

  1. php代码删除文件,三种php删除文件代码
  2. EditText 实时显示输入的字数与最大输入限制长度
  3. 祖玛的复仇 Zuma's Revenge 无限人的 修改
  4. 每日韩语:韩国年轻人婚礼形式的新趋势
  5. CSUST 8.5 早训
  6. 【ASPICE】ASPICE中的变更管理-Change Management
  7. android 拍照插件,拍照录像,android原生插件
  8. Linux使用SSH上传下载文件,Linux下通过ssh scp命令上传下载文件
  9. 奇思乐高机器人怎么样_奇思机器人:学习乐高的最佳时机到底是几岁?
  10. 如何用CDR创建样式与样式集