错误1

 read udp xxx:29270->169.169.0.10:53: i/o timeout   read    主机地址加端口  >>  169.169.0.10:53好像是这个

解决方法

#错误原因
vi /etc/hosts 文件中缺少以下配置127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6#不知道谁给删的,排了一下午。。

错误2

unable to ensure pod container exists: failed to create container for [kubepods burstable pod174ffa0f-3c24-4481-9254-efce02b03001] :mkdir /sys/fs/cgroup/memory/kubepods/burstable/pod174ffa0f-3c24-4481-9254-efce02b03001: cannot allocate memory

解决方法

Cgroup泄漏,mark一下,此处使用网上的多数解决方案并米诶有解决,做一个小小的记录,在此需要对no space left的服务器进行 reboot重启,即可解决问题,出现问题的可能为段时间内删除大量的pod所致。初步思路,可以在今后的集群管理汇总,对服务器进行维修,通过删除节点,并对节点进行reboot处理

错误3

#启动calico后发现控制器成功就绪
node为0/1  但是running   查看日志 后发现以下情况 

报错信息

calico/node is not ready: BIRD is not ready: BGP not established with 10.133

原因

#搜索一下得知没有匹配到正确的网卡,发现当前节点中存在多个相似的网卡
bond1
bond1.2

解决方法

在calico.yaml中修改匹配的节点为
bond1$  重启即可#如果有节点在不同集群,网卡可能也不相同
#如,一个是eth1 一个是eth0
#可以配置为 (eth1|eth0)

错误4

#状态如下
[root@xxx calico-typha-v3.15.2]# kk get pod
NAME                                       READY   STATUS     RESTARTS   AGE
calico-kube-controllers-75d69d4b44-f4rv7   0/1     Pending    0          11m
calico-node-5dthc                          0/1     Init:0/3   0          11m
calico-node-7tw7c                          0/1     Init:0/3   0          11m
calico-node-bvvmv                          0/1     Init:0/3   0          11m
calico-node-cltbf                          0/1     Init:0/3   0          11m
calico-node-fwxs7                          0/1     Init:0/3   0          11m
calico-node-gchnf                          0/1     Init:0/3   0          11m
calico-node-p9wfc                          0/1     Init:0/3   0          11m
calico-node-wvcsz                          0/1     Init:0/3   0          11m
calico-node-xhljh                          0/1     Init:0/3   0          11m
calico-node-zg6hh                          0/1     Init:0/3   0          11m
calico-typha-588c8dbccd-gk4n5              0/1     Pending    0          11m
calico-typha-588c8dbccd-st6xm              0/1     Pending    0          11m
calico-typha-588c8dbccd-sxgzj              0/1     Pending    0          11m

 之前老有小伙伴喜欢去看污点,如下,然后想办法去去除污点,其实这不是污点的问题,下面就说名了网卡没就绪

[root@calico-typha-v3.15.2]# k describe node | grep Tain
Taints:             node.kubernetes.io/not-ready:NoSchedule
Taints:             node.kubernetes.io/not-ready:NoSchedule
Taints:             node.kubernetes.io/not-ready:NoSchedule
Taints:             node.kubernetes.io/not-ready:NoSchedule
Taints:             node.kubernetes.io/not-ready:NoSchedule
Taints:             node.kubernetes.io/not-ready:NoSchedule
Taints:             node.kubernetes.io/not-ready:NoSchedule
Taints:             node.kubernetes.io/not-ready:NoSchedule
Taints:             node.kubernetes.io/not-ready:NoSchedule
Taints:             node.kubernetes.io/not-ready:NoSchedule

我们已经得知pod在init阶段无法通过,查看describe得到如下信息

查看node信息----     ------                  ----                  ----                   -------Normal   Scheduled               <unknown>             default-scheduler      Successfully assigned kube-system/calico-node-5dthc to 192.168.1.20Warning  FailedCreatePodSandBox  35s (x10 over 7m56s)  kubelet, 192.168.1.20  Failed to create pod sandbox: rpc error: code = Unknown desc = failed pulling image "192.168.1.20:80/google_containers/pause:3.1": Error response from daemon: Get http://192.168.1.20:80/v2/: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)#我们得知
failed pulling image "192.168.1.20:80/google_containers/pause:3.1"
#在创建pod时,没有成功拉取到pause的基础镜像
#发现仓库里面忘记上传了,已解决

错误5

calico 状态异常(0/1)修复Warning  Unhealthy  33s        kubelet, 10.252.205.100  Readiness probe failed: 2021-06-28 07:48:22.019 [INFO][222] confd/health.go 180: Number of node(s) with BGP peering established = 22
calico/node is not ready: BIRD is not ready: BGP not established with Warning  Unhealthy  23s  kubelet, 10.252.205.100  Readiness probe failed: 2021-06-28 07:48:32.013 [INFO][275] confd/health.go 180: Number of node(s) with BGP peering established = 36
calico/node is not ready: BIRD is not ready: BGP not established with 10.252.205.197Warning  Unhealthy  13s  kubelet, 10.252.205.100  Readiness probe failed: 2021-06-28 07:48:42.014 [INFO][332] confd/health.go 180: Number of node(s) with BGP peering established = 36
calico/node is not ready: BIRD is not ready: BGP not established with 10.252.205.197Warning  Unhealthy  3s  kubelet, 10.252.205.100  Readiness probe failed: 2021-06-28 07:48:52.009 [INFO][380] confd/health.go 180: Number of node(s) with BGP peering established = 36
calico/node is not ready: felix is not ready: readiness probe reporting 404Warning  Unhealthy  2s (x3 over 22s)  kubelet, 10.252.205.100  Liveness probe failed: calico/node is not ready: Felix is not live: liveness probe reporting 404#修复方法
[ecip@cmpaas-core-new-mpp-b-11 ~]$ cd /opt/cni/bin/
[ecip@cmpaas-core-new-mpp-b-11 bin]$ ls
bandwidth  calico  calico-ipam  flannel  host-local  loopback  portmap  tuning#备份以下配置
mv * linshi#备份挂载文件
[ecip@cmpaas-core-new-mpp-b-11 bin]$ cd /var/run/calico/
[ecip@cmpaas-core-new-mpp-b-11 calico]$ ls
bird6.ctl  bird.ctl  cgroup#mv * linshi#重启该节点kubelet到master上delete pod 该calico解决

错误6  生产环境有一个calico pod容器起不来

#通过describe 得到的事件信息Readiness probe failed: calico/node is not ready: BIRD is not ready: Error querying
BIRD: unable to connect to BIRDv4 socket: dial unix /var/run/bird/bird.ctl: connect:no such file or directoryLiveness probe failed: calico/node is not ready: bird/confd is not live: exit status 1

日志

Jul 27 10:17:27 cmpaas-core-new-mpp-j-1 kubelet[47192]: E0727 10:17:27.076332  47192 kuberuntime_manager.go:674] killPodWithSyncResult failed: failed to
"KillPodSandbox" for "d49635fa-a070-469d-9228-d64a900e4403" with KillPodSandboxError:"rpc error: code = Unknown desc = networkPlugin cni failed to teardown pod \"kong-
migrations-pqwll_kong\" network: error getting ClusterInformation: Get
https://[169.169.0.1]:443/apis/crd.projectcalico.org/v1/clusterinformations/default:dial tcp 169.169.0.1:443: i/o timeout"

其实结尾的这个错误已经很明显了,tcp 169.169.0.1:443: i/o timeout"

9成是kube-proxy导致的跑不了

再次查看calico pod日志(等一会)
[ecip@cmpaas-core-new-mpp-b-11 ~]$ kk logs calico-node-xm5qz 2021-07-27 02:52:28.597 [INFO][8] startup/startup.go 374: Hit error connecting to
datastore - retry error=Get https://169.169.0.1:443/api/v1/nodes/foo: dial tcp
169.169.0.1:443: i/o timeout

检查一下kube-proxy

k8s.io/client-go/informers/factory.go:135: Failed to list *v1.Service: Gethttps://192.168.1.20:6443/api/v1
/services?labelSelector=%21service.kubernetes.io%2Fheadless
%2C%21service.kubernetes.io%2Fservice-proxy-name&limit=500&resourceVersion=0: dial tcp
192.168.1.21:6443: connect: connection refused##发现该节点kube-proxy无法连接apiserver

得知这个节点之前是其他集群的,我在想是否有可能是因为集群证书 漏掉了,

没有替换新的导致的,替换证书,重启节点服务,delete pod恢复

kubernetes报错笔记 (一) calico报错相关推荐

  1. 【报错笔记】程序报错:Cause: java.sql.SQLException: Invalid value for getInt() - ‘4ab72edc-c02f-423f-ae9e-18c30

    程序报错:Cause: java.sql.SQLException: Invalid value for getInt() - '4ab72edc-c02f-423f-ae9e-18c306e2cda ...

  2. calico报错Init:0/3或Init:RunContainerError

    文章目录 coredns报错状态和原因说明 calico部署报错原因及处理 报错部署说明 报错Init:0/3说明及处理 报错Init:RunContainerError 部署正常显示内容,cored ...

  3. K8S 报错笔记--持续更新

    一.ContainerCreating 这种报错其实不算报错,容器正在创建中,通常是我们配置问题导致的, 1.docker服务问题 有一天起来有个应用说容器创建不出来,卡在ContainerCreat ...

  4. pom.xml内容没有错,但一直报错红叉 解决办法

    转自:http://www.cnblogs.com/sxdcgaq8080/p/5590254.html [maven] pom.xml内容没有错,但一直报错红叉 解决办法 1.首先看一下下面的这两个 ...

  5. rpm安装mysql报错_【CentOS-65】通过rpm包安装mysql57解决了server报错和mysqld启动报错的问题...

    [CentOS-6.5]通过rpm包安装mysql5.7(解决了server包安装报错和mysqld启动报错的问题) 一.官网下载rpm包二.安装 wget三.检查是否已有数据库四.在linux在解压 ...

  6. mysql启动报错2002_mysql登陆启动报错 ERROR 2002 (HY000) 解决方法

    报错信息 登陆数据库报错:` ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/var/lib/mysq ...

  7. ANSYS-CFX,计算时报错,内存参数报错,return code 1【终极解决方案】

    ANSYS-CFX,计算时报错,内存参数报错,return code 1[终极解决方案] 在CFX计算时经常会遇到内存不足的错误报告,有的算例网格并不多也会出现这样的问题,本文就最近遇到的内存错误问题 ...

  8. android studio闪退代码不报错_代码不报错,不代表真的没错

     今天是生信星球陪你的第695天 大神一句话,菜鸟跑半年.我不是大神,但我可以缩短你走弯路的半年~ 就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~ 这里有豆豆和花花的学习历程,从新 ...

  9. urllib.request.urlopen(req).read().decode解析http报文报“‘utf-8‘ codec can‘t decode”错处理

    urllib.request.urlopen(req).read().decode解析http报文报"'utf-8' codec can't decode"错处理:https:// ...

  10. 闪退没由报错_关于floor()报错注入,你真的懂了吗?

    0x01 简述 floor报错注入也有叫group报错注入的,都一样,指的都是他们.floor报错注入我想大多数人跟我一样,都是会用而不明白其中的原理.这个问题困扰了在下好长时间了,所以决定好好研究下 ...

最新文章

  1. PIM-SM DR指定路由器以及 PIM-DM指定前转器的区别 【转自网络】
  2. oracle rman 架构图,图解Oracle RMAN备份入门
  3. js返回上一页并刷新代码整理 转
  4. excel流程图分叉 合并_Excel和Visio联姻,自动生成跨职能流程图,还能用图标标记状态,太牛了!...
  5. kafka配置文件 中文乱码_Kafka学习之配置文件详解
  6. Jerry文章《浅谈Java和SAP ABAP的静态代理和动态代理,以及ABAP面向切面编程的尝试一文的源代码》
  7. 20145209 2016-2017-2 《Java程序设计》第9周学习总结
  8. 如何查看某个查询用了多少TempDB空间
  9. 如何实现TextBox与DropDownList的级联
  10. matlab三维三角网格,有限元分析利用matlab的gplot函数实现三维划分网格的方法
  11. 3803. 数组去重-AcWing题库
  12. oracle数据转换,Oracle数据库转换函数
  13. Matlab编写摩斯代码,以摩斯电码为例为 Arduino 编写库
  14. 矩阵分析之 实矩阵分解(3)Cholesky分解
  15. 重装系统不识别固态硬盘进入PE系统时候卡死
  16. 【蓝凌表单】流程表单JS汇总
  17. 【20210401】用Python的turtle库绘制呲牙表情包
  18. 网站中的新老访客怎么定义,有何区别?
  19. 梦江湖获取服务器信息,《一梦江湖》6月5日更新公告
  20. [译]2019版 web 浏览器现状

热门文章

  1. 多伦多大学-强化学习导论-2022
  2. java web 嵌套播放器_网页中嵌套视频播放器
  3. 关于局域网中IP地址被盗用的探讨
  4. 吉大19秋学期计算机应用基础在线作业,吉大11春学期《计算机应用基础》在线作业二答案...
  5. 校园兼职平台的设计与开发
  6. python素描画_python实现彩照转黑白以及图片转素描画
  7. Bayesian Methods for Hackers笔记
  8. python学完多少钱_Python学完后一般能拿多少钱?老男孩Python课程学习
  9. 【高光谱】成像基础知识
  10. 【R生态】R语言维恩图(Venn)集合图(Upset)的选择与绘制