etcd问题踩坑cluster ID mismatch
记一次etcd集群搭建报错
systemctl restart etcd.service
Job for etcd.service failed because a timeout was exceeded. See "systemctl status etcd.service" and "journalctl -xe" for details.
报错信息如下:
request sent was ignored (cluster ID mismatch: peer[f73f6335fab3c75e]=903824bb6a071282, local=6a166fcbd8bb0e32)etcdctl cluster-health
cluster may be unhealthy: failed to list members
Error: client: etcd cluster is unavailable or misconfigured; error #0: dial tcp 127.0.0.1:4001: connect: connection refused
; error #1: client: endpoint http://127.0.0.1:2379 exceeded header timeout
error #0: dial tcp 127.0.0.1:4001: connect: connection refused
error #1: client: endpoint http://127.0.0.1:2379 exceeded header timeout
问题产生过程:
环境:三个节点的etcd集群
hosts信息如下
ip1 node1
ip2 node2
ip3 node3
使用yum安装etcd,然后定义了data-dir并给以用户权限
配置文件格式 其他两个节点对应修改ip即可
ETCD_NAME="etcd1"
ETCD_DATA_DIR="/opt/etcd/data/etcd1.etcd"
ETCD_LISTEN_PEER_URLS="http://ip1:2380"
ETCD_LISTEN_CLIENT_URLS="http://ip1:2379,http://127.0.0.1:2379"
ETCD_INITIAL_ADVERTISE_PEER_URLS="http://ip1:2380"
ETCD_ADVERTISE_CLIENT_URLS="http://ip1:2379"
ETCD_INITIAL_CLUSTER="etcd1=http://ip1:2380,etcd2=http://ip2:2380,etcd3=http://ip3:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"
ETCD_ADVERTISE_CLIENT_URLS="http://ip1:2379"
同时在三个节点启动etcd 执行systemctl start etcd.service,node1出现问题
node1产生了类似于僵尸进程的样子,etcd由父进程 1–systemd拉起,怎么也kill不掉(kill之后接着启动)
然后此时node2 node3是一个有两个节点的集群
由于node1关不掉,便换了一台新的服务器作为节点加入,问题依然是上方报错
后验证了selinux 防火墙 网络端口等条件都是正常的
但节点作为集群启动(ETCD_INITIAL_CLUSTER=“etcd1=http://ip1:2380”),发现启动成功,集群状态正常
怀疑是数据目录缓存问题
于是三台机器停止etcd服务,并清空datadir,然后同时启动,问题得到解决,集群正常。
分析&&总结
1、node1 etcd服务不停被systemd拉起原因还没排查到
2、重做集群的时候要把另外的服务器的数据目录情况下(应该是清空某个缓存,因为重新定义了配置文件中服务器的ip后并没有生效)
etcd问题踩坑cluster ID mismatch相关推荐
- k8s集群部署中etcd启动报错request sent was ignored (cluster ID mismatch: peer[c39bdec535db1fd5]=cdf818194e3a8c
k8s集群部署中etcd启动报错处理 报错信息如下,主要报错信息有两条 原因是/var/lib/etcd/目录下缓存导致 解决方法 问题2: Error starting daemon: SELinu ...
- OpenDDS踩坑(2)-DCPSInfoRepo ERROR add_domain_participant returned invalid id
OpenDDS踩坑(2)-DCPSInfoRepo add_domain_participant returned invalid id 本文针对OpenDDS新手处理无法正常运行测试项目问题. 测试 ...
- k8s containerd集群配置安装完整踩坑教程
完整踩坑和精简内容 k8s containerd配置 containerd安装参考 k8s安装参考 环境 两台机器 hostnamectl set-hostname master hostnamect ...
- Prometheus 踩坑集锦
Prometheus 踩坑集锦 1 几点原则 2 Prometheus 的局限 3 K8S 集群中常用的 exporter 4 K8S 核心组件监控与 Grafana 面板 5 采集组件 All IN ...
- 前端静态服务踩坑实践
前言 随着前端项目的增大,越来越多时候会把动静态资源进行分离部署,对于分离部署时常常涉及到代理转发的问题,专网项目主要使用 nginx + docker + k8s的部署方式,本文主要分享一些相关项目 ...
- Elasticsearch集群扩容踩坑记录
ES集群扩容构建踩坑总结 文章目录 ES集群扩容构建踩坑总结 @[toc] 需求 配置 参数说明 Data node's cluster uuid diffrent from master node' ...
- hive3编译 on tez+tez-ui配置和遇到的兼容问题与踩坑记录
框架 版本号 Hadoop 3.1.3 Hive 3.1.2 Tez 0.10.1 需要资料包的可以关注我微信公众号(最底有二维码),回复关键字"tez"领取 tez是一个Hive ...
- Canal 及canal.admin(v1.1.5)踩坑记录
网址:GitHub - alibaba/canal: 阿里巴巴 MySQL binlog 增量订阅&消费组件 前期软件准备 上面的软件包(canal.deployer-1.1.5.tar.gz ...
- (二)K8s踩坑记录
文章目录 1 kubeadm join报错 2 Unable to connect to the server: x509 3 coredns一直处于ContainerCreating状态 4 nod ...
最新文章
- 51单片机好学嘛?学完51单片机学什么?
- TP5 实现转盘抽奖
- “网络爸爸”的密码破解
- 如何通过构建以太坊智能合约来销售商品
- android 新闻编辑,超机访问:ZOL手机新闻编辑背后的故事
- c语言错误重定义,C语言的重定义错误求解
- 控制属性修改时间,控制时间,联合主键
- 华为鸿蒙万物互联应用,为什么我需要万物互联? 鸿蒙能带来什么?
- 【转】SpringCloud学习
- 红黑树(Red Black Tree)
- android SDK 常见安装方法
- Hadoop HA集群部署
- MATLAB安装“geoidegm2008grid.mat”数据(EGM2008模型计算大地水准面和高程异常)
- 树莓派从零开始学习记录
- 计算机组成dr是什么意思,体检中DR诊断是什么意思
- Windows XP SP3安装教程(图)
- 名帖298 王铎 行书《罗汉跋》
- VTK 三维 重建 切割 三维点云
- Liunx中shell命令行和权限的理解
- html5表格在线生成,专业的Web报表工具——表格在线生成制作工具