记一次etcd集群搭建报错

systemctl restart  etcd.service
Job for etcd.service failed because a timeout was exceeded. See "systemctl status etcd.service" and "journalctl -xe" for details.
报错信息如下:
request sent was ignored (cluster ID mismatch: peer[f73f6335fab3c75e]=903824bb6a071282, local=6a166fcbd8bb0e32)etcdctl cluster-health
cluster may be unhealthy: failed to list members
Error:  client: etcd cluster is unavailable or misconfigured; error #0: dial tcp 127.0.0.1:4001: connect: connection refused
; error #1: client: endpoint http://127.0.0.1:2379 exceeded header timeout
error #0: dial tcp 127.0.0.1:4001: connect: connection refused
error #1: client: endpoint http://127.0.0.1:2379 exceeded header timeout

问题产生过程:

环境:三个节点的etcd集群
hosts信息如下

ip1 node1
ip2 node2
ip3 node3

使用yum安装etcd,然后定义了data-dir并给以用户权限

配置文件格式 其他两个节点对应修改ip即可

ETCD_NAME="etcd1"
ETCD_DATA_DIR="/opt/etcd/data/etcd1.etcd"
ETCD_LISTEN_PEER_URLS="http://ip1:2380"
ETCD_LISTEN_CLIENT_URLS="http://ip1:2379,http://127.0.0.1:2379"
ETCD_INITIAL_ADVERTISE_PEER_URLS="http://ip1:2380"
ETCD_ADVERTISE_CLIENT_URLS="http://ip1:2379"
ETCD_INITIAL_CLUSTER="etcd1=http://ip1:2380,etcd2=http://ip2:2380,etcd3=http://ip3:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"
ETCD_ADVERTISE_CLIENT_URLS="http://ip1:2379"

同时在三个节点启动etcd 执行systemctl start etcd.service,node1出现问题
node1产生了类似于僵尸进程的样子,etcd由父进程 1–systemd拉起,怎么也kill不掉(kill之后接着启动)
然后此时node2 node3是一个有两个节点的集群

由于node1关不掉,便换了一台新的服务器作为节点加入,问题依然是上方报错
后验证了selinux 防火墙 网络端口等条件都是正常的

但节点作为集群启动(ETCD_INITIAL_CLUSTER=“etcd1=http://ip1:2380”),发现启动成功,集群状态正常
怀疑是数据目录缓存问题
于是三台机器停止etcd服务,并清空datadir,然后同时启动,问题得到解决,集群正常。

分析&&总结

1、node1 etcd服务不停被systemd拉起原因还没排查到
2、重做集群的时候要把另外的服务器的数据目录情况下(应该是清空某个缓存,因为重新定义了配置文件中服务器的ip后并没有生效)

etcd问题踩坑cluster ID mismatch相关推荐

  1. k8s集群部署中etcd启动报错request sent was ignored (cluster ID mismatch: peer[c39bdec535db1fd5]=cdf818194e3a8c

    k8s集群部署中etcd启动报错处理 报错信息如下,主要报错信息有两条 原因是/var/lib/etcd/目录下缓存导致 解决方法 问题2: Error starting daemon: SELinu ...

  2. OpenDDS踩坑(2)-DCPSInfoRepo ERROR add_domain_participant returned invalid id

    OpenDDS踩坑(2)-DCPSInfoRepo add_domain_participant returned invalid id 本文针对OpenDDS新手处理无法正常运行测试项目问题. 测试 ...

  3. k8s containerd集群配置安装完整踩坑教程

    完整踩坑和精简内容 k8s containerd配置 containerd安装参考 k8s安装参考 环境 两台机器 hostnamectl set-hostname master hostnamect ...

  4. Prometheus 踩坑集锦

    Prometheus 踩坑集锦 1 几点原则 2 Prometheus 的局限 3 K8S 集群中常用的 exporter 4 K8S 核心组件监控与 Grafana 面板 5 采集组件 All IN ...

  5. 前端静态服务踩坑实践

    前言 随着前端项目的增大,越来越多时候会把动静态资源进行分离部署,对于分离部署时常常涉及到代理转发的问题,专网项目主要使用 nginx + docker + k8s的部署方式,本文主要分享一些相关项目 ...

  6. Elasticsearch集群扩容踩坑记录

    ES集群扩容构建踩坑总结 文章目录 ES集群扩容构建踩坑总结 @[toc] 需求 配置 参数说明 Data node's cluster uuid diffrent from master node' ...

  7. hive3编译 on tez+tez-ui配置和遇到的兼容问题与踩坑记录

    框架 版本号 Hadoop 3.1.3 Hive 3.1.2 Tez 0.10.1 需要资料包的可以关注我微信公众号(最底有二维码),回复关键字"tez"领取 tez是一个Hive ...

  8. Canal 及canal.admin(v1.1.5)踩坑记录

    网址:GitHub - alibaba/canal: 阿里巴巴 MySQL binlog 增量订阅&消费组件 前期软件准备 上面的软件包(canal.deployer-1.1.5.tar.gz ...

  9. (二)K8s踩坑记录

    文章目录 1 kubeadm join报错 2 Unable to connect to the server: x509 3 coredns一直处于ContainerCreating状态 4 nod ...

最新文章

  1. 51单片机好学嘛?学完51单片机学什么?
  2. TP5 实现转盘抽奖
  3. “网络爸爸”的密码破解
  4. 如何通过构建以太坊智能合约来销售商品
  5. android 新闻编辑,超机访问:ZOL手机新闻编辑背后的故事
  6. c语言错误重定义,C语言的重定义错误求解
  7. 控制属性修改时间,控制时间,联合主键
  8. 华为鸿蒙万物互联应用,为什么我需要万物互联? 鸿蒙能带来什么?
  9. 【转】SpringCloud学习
  10. 红黑树(Red Black Tree)
  11. android SDK 常见安装方法
  12. Hadoop HA集群部署
  13. MATLAB安装“geoidegm2008grid.mat”数据(EGM2008模型计算大地水准面和高程异常)
  14. 树莓派从零开始学习记录
  15. 计算机组成dr是什么意思,体检中DR诊断是什么意思
  16. Windows XP SP3安装教程(图)
  17. 名帖298 王铎 行书《罗汉跋》
  18. VTK 三维 重建 切割 三维点云
  19. Liunx中shell命令行和权限的理解
  20. html5表格在线生成,专业的Web报表工具——表格在线生成制作工具

热门文章

  1. 安装win10系统时提示只能安装到GPT分区解决方法
  2. Xftp传输文件失败解决办法
  3. hdu3498 whosyourdaddy--可重复覆盖舞蹈链
  4. imfilter函数详解
  5. Linux命令:du+find分析目录大小,清理空间
  6. CocoaPods原理
  7. 2021CCPC河南省赛 E:闯关游戏(简单DP)
  8. SQL游戏行业实战案例2:玩家等级(union、分组、排序)
  9. JSTL标签forEach
  10. Python简介、linux上Python及其IDE的安装和详细配置