贝叶斯网络与元建模:建筑能耗生成式设计的智能优化方法
2026/5/10 5:51:19
kubectl describe pod抓重启关键信息这是最直接的入口,能快速获取重启次数、原因和触发事件。
kubectl describe pod <Pod名称> -n <命名空间>。Error(代码错误)或OOMKilled(内存溢出,高频原因),会直接标注。kubectl logs查应用崩溃日志若第一步发现是Error退出,必须通过日志定位代码或配置问题。
kubectl logs <Pod名称> -n <命名空间> --previous,这能获取 Pod 重启前的错误堆栈(如代码报错、配置文件缺失),是定位应用层问题的核心。kubectl logs <Pod名称> -n <命名空间> -f实时捕捉启动到崩溃的日志,观察是否卡在特定步骤(如连接依赖超时)。排除应用本身问题后,多数重启源于资源不足或健康检查误判。
Last State显示OOMKilled,执行kubectl top pod <Pod名称> -n <命名空间>,对比 Pod 的resources.limits配置,确认是否内存 / CPU 超限制(比如限制 1Gi 内存,实际用了 1.2Gi)。livenessProbe(存活检查)配置,比如端口写错、检查路径不存在,或应用启动慢导致 “启动中被误判为死锁而重启”(可拉长initialDelaySeconds解决)。