AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • 主页
  • 系统&网络
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • 主页
  • 系统&网络
    • 最新
    • 热门
    • 标签
  • Ubuntu
    • 最新
    • 热门
    • 标签
  • Unix
    • 最新
    • 标签
  • DBA
    • 最新
    • 标签
  • Computer
    • 最新
    • 标签
  • Coding
    • 最新
    • 标签
主页 / server / 问题 / 1036683
Accepted
username_not_found
username_not_found
Asked: 2020-10-07 13:05:48 +0800 CST2020-10-07 13:05:48 +0800 CST 2020-10-07 13:05:48 +0800 CST

超出 GKE 上下文期限:CreateContainerError 并且未能保留容器名称

  • 772

我正在运行一个 GKE 集群,有时,其中一个节点与从php7-alpine.

我们运行两种类型的容器,第一种类型是从 构建的php7-alpine,第二种类型是从第一种类型构建的。( php7-alpine-> Base App-> App with extra)。只有我们Base App Pods有这些问题。

到目前为止,我已经看到以下错误:

  • failed to reserve container name
  • FailedSync: error determining status: rpc error: code = Unknown desc = Error: No such container: XYZ
  • Error: context deadline exceeded context deadline exceeded: CreateContainerError

节点上有大量磁盘空间,kubectl describe pod不包含任何相关/有用的信息。

更多细节:

  • 在 50 个Base app中,有 6 个 pod 出错,并且在所有App with extrapod 中,没有一个失败。
  • 所有失败的 pod 总是在同一个节点上。
  • 我们已经重新创建/替换了节点。问题仍然存在,如果我们用有故障的 pod 替换节点,我们有 50/50% 的概率让下一个节点上的所有 pod 都正常。问题显得有些随机。
  • 运行 GKE v1.17.9-gke.1504
  • 我们在可抢占节点上运行。
  • 容器图像非常大(~3gb,正在努力减少)。
  • 问题可能在一个月前开始。

我真的不知道要寻找什么,我已经广泛寻找类似的问题。任何帮助是极大的赞赏!

更新:

这是部署

apiVersion: apps/v1
kind: Deployment
metadata:
  labels:
    app: my-app
    appType: web
    env: prod
  name: my-app
  namespace: default
spec:
  replicas: 2
  selector:
    matchLabels:
      app: my-app
  strategy:
    rollingUpdate:
      maxSurge: 1
      maxUnavailable: 0
    type: RollingUpdate
  template:
    metadata:
      labels:
        app: my-app
        version: v1.0
    spec:
      containers:
          image: richarvey/nginx-php-fpm:latest  # We build upon that image to add content and services
          lifecycle:
            preStop:
              exec:
                command:
                  - /entry-point/stop.sh
          name: web
          ports:
            - containerPort: 80
              protocol: TCP
          resources:
            requests:
              cpu: 50m
              memory: 1500Mi
        - image: redis:4.0-alpine
          name: redis
          resources:
            requests:
              cpu: 25m
              memory: 25Mi
          terminationMessagePath: /dev/termination-log
          terminationMessagePolicy: File
google-cloud-platform docker kubernetes google-kubernetes-engine
  • 1 1 个回答
  • 3750 Views

1 个回答

  • Voted
  1. Best Answer
    username_not_found
    2022-02-18T10:21:33+08:002022-02-18T10:21:33+08:00

    该问题已被调查并修复。

    https://github.com/containerd/containerd/issues/4604

    • 0

相关问题

  • 带有 OpenVPN 的 Google Compute Engine 上的 VPN 服务器

  • 如果您失去了 Google Apps 的管理员权限,如何恢复?

  • 云有多大?[关闭]

  • 谷歌应用引擎中的 joomla

  • 无需短信即可注册 Google AppEngine?

Sidebar

Stats

  • 问题 205573
  • 回答 270741
  • 最佳答案 135370
  • 用户 68524
  • 热门
  • 回答
  • Marko Smith

    新安装后 postgres 的默认超级用户用户名/密码是什么?

    • 5 个回答
  • Marko Smith

    SFTP 使用什么端口?

    • 6 个回答
  • Marko Smith

    命令行列出 Windows Active Directory 组中的用户?

    • 9 个回答
  • Marko Smith

    什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同?

    • 3 个回答
  • Marko Smith

    如何确定bash变量是否为空?

    • 15 个回答
  • Martin Hope
    Tom Feiner 如何按大小对 du -h 输出进行排序 2009-02-26 05:42:42 +0800 CST
  • Martin Hope
    Noah Goodrich 什么是 Pem 文件,它与其他 OpenSSL 生成的密钥文件格式有何不同? 2009-05-19 18:24:42 +0800 CST
  • Martin Hope
    Brent 如何确定bash变量是否为空? 2009-05-13 09:54:48 +0800 CST
  • Martin Hope
    cletus 您如何找到在 Windows 中打开文件的进程? 2009-05-01 16:47:16 +0800 CST

热门标签

linux nginx windows networking ubuntu domain-name-system amazon-web-services active-directory apache-2.4 ssh

Explore

  • 主页
  • 问题
    • 最新
    • 热门
  • 标签
  • 帮助

Footer

AskOverflow.Dev

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve