背景:将社区的SBN Read(Observer NameNode)相关patch合入我们的分支时,在测试集群上测试,遇到一个非常严重的BUG,会导致NameNode挂掉以及数据丢失。

先说解决方案:
HDFS-14317解决了这个问题,我们移植的时候没看到这个patch在ONN的sub-task里,因此漏移植了。

具体细节:

开始我们不知道社区已经有了bug fix,于是提了一个ISSUE,将详细的日志信息都挂在了HDFS-16507上。

我来描述一下现象,在edits_inprogress_xxxx会被错误地purge(清理)掉,然后active namenode尝试finalize segment的时候找不到对应的txid,然后导致一个FATAL错误,namenode挂掉。

问题根源:

由于引入了Observer Namenode,于是需要开启tail in-progress状态的editlog。配置为:

<property>

【HDFS】Observer Namenode开启in-progress tail之后导致误删除in-progress状态的editlog问题相关推荐

  1. ERROR org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode: Exception in doCheckpoint

    grep -ri Exception得到如下信息: /home/appleyuchi/bigdata/hadoop-3.2.1/logs/hadoop-appleyuchi-secondaryname ...

  2. Hive启动报错org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeE...

    Caused by: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.server.namenode.SafeModeExce ...

  3. namenode开启DEBUG

    参考: https://blog.csdn.net/alphags/article/details/53351627 https://blog.csdn.net/alphags/article/det ...

  4. HDFS超租约异常总结(org.apache.hadoop.hdfs.server.namenode.LeaseExpiredException)

    异常信息: 13/09/11 12:12:06 INFO hdfs.DFSClient: SMALL_BUFFER_SIZE is 512 org.apache.hadoop.ipc.RemoteEx ...

  5. Hadoop HA HDFS启动 NameNode启动失败解析

    今天也要努力学习 作者大哥:me2xp  https://www.linuxidc.com/Linux/2016-03/129437.htm 看日志真的很重要!!!!!!!!!! 一.问题描述 HA按 ...

  6. 基于阿里云服务器搭建hadoop集群:HDFS的namenode WEB访问9870端口打不开解决方法

    基于阿里云服务器搭建hadoop集群:HDFS的namenode WEB访问9870端口打不开解决方法 以下是基于我所面临问题的解决办法. 1.在本地的c:windows/system32/dirve ...

  7. hive报错(org.apache.hadoop.hdfs.server.namenode.SafeModeException): Cannot create directory/tmp/hive/.

    报错场景: 使用shell脚本进行对hive的数据查询导入导致出错,先是hive执行时间较长,后面hive报错. 问题描述: 使用jps查询进程,发现有三个hive进程,三个RunJar,RunJar ...

  8. 7.HDFS之——NameNode的概述、自动Name的概述、NameNode HA 集群搭建

    7.HDFS NameNode HA 7.1 NameNode HA概述 所谓HA(High Availablity [əˌveɪlə'bɪləti] ),即高可用(7x24小时服务不中断).通过主备 ...

  9. 安全狗php站点404,开启安全狗响应内容保护导致404返回200状态码的解决办法

    开启安全狗响应内容保护导致404返回200状态码的解决办法 2020-04-08 开启安全狗响应内容保护导致404状态码返回200的解决办法 今天无意中对www.tbadc.com的404错识做了一个 ...

最新文章

  1. 如何水平居中一个元素
  2. 第四范式@2020 WAIC世界人工智能大会
  3. am335x PDK3.0 设置为单网口配置记录
  4. 机器学习笔记(九)——决策树的生成与剪枝
  5. 如何显示Windows 10登录过程详细信息
  6. 为什么浏览器User-agent(浏览器类型)总是有Mozilla字样?
  7. kali linux Python开发环境初始化
  8. ntoskrnl.exe蓝屏
  9. 烧录工具Android Tool的使用
  10. MySQL中的保留字
  11. HITB_Binary_100_writeup
  12. 【20点埃及 VS 乌拉圭/23点摩洛哥vs 伊朗】快看人工只能预测结果(附最全赛事时间表)...
  13. ASP.NET Core中的TagHelper及其用法
  14. Virtuoso Layout 系列教程:01 软件安装教程 - 附资源包
  15. 参考C++高级进阶教程
  16. C语言编程>第十六周 ⑦ s是全部由小写字母字符和空格字符组成的字符串,由len传入字符串的长度,请补充fun函数,该函数的功能是:统计字符串s中的单词数,结果由变量len传回。
  17. 随笔:读书笔记 --《见识:商业的本质和人生的智慧》
  18. 教你绘制一张精美的思维导图
  19. task1 赛题理解
  20. 服务器系统不打补丁,windows系统打补丁导致系统起不来处理

热门文章

  1. 手机音质变差_为什么不同手机音质差别那么大?这4个方面很重要
  2. maxcms支持mysql吗_马克斯maxCMS整合M3U8播放器插件+教程
  3. 机器学习与计算机视觉入门项目——视频投篮检测(一)
  4. 一部现世安稳、岁月静好的传奇
  5. 看你朋友圈,就知道你很缺爱
  6. Terminal-笔记-1.0
  7. iOS调用各大地图APP导航,进行路线规划
  8. 物联网操作系统有哪些特点
  9. elasticsearch7.2安装
  10. 中国手机游戏业的若干矛盾