Kubernetes常见问题处理办法

2025-07-22 18:37:00
丁国栋
原创 133
摘要:Kubernetes常见问题处理办法

问题1:所有 Pod 均无法访问,例如 CoreDNS Pod 日志显示无法读取 Kubernetes API,所有具备健康检查探针的 Pod 均无法通过健康检查

解决方案:检查服务器网卡 cni0 状态、路由和防火墙(包含 iptables ),检查 Pod 网络(cni0网卡网络)的路由是否存在异常,正常情况下在 K8S 节点内的 Pod IP 应该都能访问到,ClusterIP 可能无法在主机上直接访问到(当然也可能可以访问到)。


问题2:Pod 经常重启,通过 kubectl describe podkubectl logs --previous 均没有有效信息,事件中显示:Back-off restarting failed container

解决方案:通过 kubectl get pod -o wide 获取该 Pod 所在的节点,通过 kubectl describe node 查看节点的事件,检查事件中是否有 OomGuardKillContaineroom-guard 等关键字,确定 Pod 是否是因为内存不够导致进程被杀死而重启。


问题3:Pod 处于Pending 状态,检查 Pod 发现事件 0/8 nodes are available: 1 node(s) had untolerated taint {node.kubernetes.io/unreachable: }, 7 node(s) didn't match Pod's node affinity/selector. preemption: 0/8 nodes are available: 8 Preemption is not helpful for scheduling.。可知这个Pod 存在亲和性和选择器,而符合条件的节点被标记为不可达到的污点,这说明节点处于NotReady的状态,经过检查节点确实如此。通过解决节点问题解决。

发表评论
博客分类