【HDFS】Observer Namenode开启in-progress tail之后导致误删除in-progress状态的editlog问题
背景:将社区的SBN Read(Observer NameNode)相关patch合入我们的分支时,在测试集群上测试,遇到一个非常严重的BUG,会导致NameNode挂掉以及数据丢失。
先说解决方案:
HDFS-14317解决了这个问题,我们移植的时候没看到这个patch在ONN的sub-task里,因此漏移植了。
具体细节:
开始我们不知道社区已经有了bug fix,于是提了一个ISSUE,将详细的日志信息都挂在了HDFS-16507上。
我来描述一下现象,在edits_inprogress_xxxx会被错误地purge(清理)掉,然后active namenode尝试finalize segment的时候找不到对应的txid,然后导致一个FATAL错误,namenode挂掉。
问题根源:
由于引入了Observer Namenode,于是需要开启tail in-progress状态的editlog。配置为:
<property>
【HDFS】Observer Namenode开启in-progress tail之后导致误删除in-progress状态的editlog问题相关推荐
- ERROR org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode: Exception in doCheckpoint
grep -ri Exception得到如下信息: /home/appleyuchi/bigdata/hadoop-3.2.1/logs/hadoop-appleyuchi-secondaryname ...
- Hive启动报错org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeE...
Caused by: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeExce ...
- namenode开启DEBUG
参考: https://blog.csdn.net/alphags/article/details/53351627 https://blog.csdn.net/alphags/article/det ...
- HDFS超租约异常总结(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException)
异常信息: 13/09/11 12:12:06 INFO hdfs.DFSClient: SMALL_BUFFER_SIZE is 512 org.apache.hadoop.ipc.RemoteEx ...
- Hadoop HA HDFS启动 NameNode启动失败解析
今天也要努力学习 作者大哥:me2xp https://www.linuxidc.com/Linux/2016-03/129437.htm 看日志真的很重要!!!!!!!!!! 一.问题描述 HA按 ...
- 基于阿里云服务器搭建hadoop集群:HDFS的namenode WEB访问9870端口打不开解决方法
基于阿里云服务器搭建hadoop集群:HDFS的namenode WEB访问9870端口打不开解决方法 以下是基于我所面临问题的解决办法. 1.在本地的c:windows/system32/dirve ...
- hive报错(org.apache.hadoop.hdfs.server.namenode.SafeModeException): Cannot create directory/tmp/hive/.
报错场景: 使用shell脚本进行对hive的数据查询导入导致出错,先是hive执行时间较长,后面hive报错. 问题描述: 使用jps查询进程,发现有三个hive进程,三个RunJar,RunJar ...
- 7.HDFS之——NameNode的概述、自动Name的概述、NameNode HA 集群搭建
7.HDFS NameNode HA 7.1 NameNode HA概述 所谓HA(High Availablity [əˌveɪlə'bɪləti] ),即高可用(7x24小时服务不中断).通过主备 ...
- 安全狗php站点404,开启安全狗响应内容保护导致404返回200状态码的解决办法
开启安全狗响应内容保护导致404返回200状态码的解决办法 2020-04-08 开启安全狗响应内容保护导致404状态码返回200的解决办法 今天无意中对www.tbadc.com的404错识做了一个 ...
最新文章
- 如何水平居中一个元素
- 第四范式@2020 WAIC世界人工智能大会
- am335x PDK3.0 设置为单网口配置记录
- 机器学习笔记(九)——决策树的生成与剪枝
- 如何显示Windows 10登录过程详细信息
- 为什么浏览器User-agent(浏览器类型)总是有Mozilla字样?
- kali linux Python开发环境初始化
- ntoskrnl.exe蓝屏
- 烧录工具Android Tool的使用
- MySQL中的保留字
- HITB_Binary_100_writeup
- 【20点埃及 VS 乌拉圭/23点摩洛哥vs 伊朗】快看人工只能预测结果(附最全赛事时间表)...
- ASP.NET Core中的TagHelper及其用法
- Virtuoso Layout 系列教程:01 软件安装教程 - 附资源包
- 参考C++高级进阶教程
- C语言编程>第十六周 ⑦ s是全部由小写字母字符和空格字符组成的字符串,由len传入字符串的长度,请补充fun函数,该函数的功能是:统计字符串s中的单词数,结果由变量len传回。
- 随笔:读书笔记 --《见识:商业的本质和人生的智慧》
- 教你绘制一张精美的思维导图
- task1 赛题理解
- 服务器系统不打补丁,windows系统打补丁导致系统起不来处理