AskOverflow.Dev

AskOverflow.Dev Logo AskOverflow.Dev Logo

AskOverflow.Dev Navigation

  • Início
  • system&network
  • Ubuntu
  • Unix
  • DBA
  • Computer
  • Coding
  • LangChain

Mobile menu

Close
  • Início
  • system&network
    • Recentes
    • Highest score
    • tags
  • Ubuntu
    • Recentes
    • Highest score
    • tags
  • Unix
    • Recentes
    • tags
  • DBA
    • Recentes
    • tags
  • Computer
    • Recentes
    • tags
  • Coding
    • Recentes
    • tags
Início / computer / Perguntas / 1449702
Accepted
should_be_working
should_be_working
Asked: 2019-06-18 07:06:46 +0800 CST2019-06-18 07:06:46 +0800 CST 2019-06-18 07:06:46 +0800 CST

Kubernetes um trabalho é movido para outro pod

  • 772

Um trabalho de execução longa (45h) é movido para outro pod, fazendo com que seja reiniciado.

Nos logs, posso ver que o trabalho recebeu um SIGTERM e foi reiniciado em outro pod e provavelmente em outro nó também.

As informações recuperadas no google cloud não estão ajudando. As páginas Yamlou eventsnão descrevem este evento, exceto para a criação do pod.

O trabalho YamlcreationTimestamp: 2019-06-15T10:39:25Z

A cápsula YamlcreationTimestamp: 2019-06-17T13:26:25Z

Eu uso principalmente uma configuração padrão 1.12.6-gke.11com vários nós e os servidores não são preemptivos.

É um comportamento padrão do k8s? Se for, como posso desativá-lo?

google-cloud-platform kubernetes
  • 1 1 respostas
  • 436 Views

1 respostas

  • Voted
  1. Best Answer
    ProgrammingLlama
    2019-06-21T06:19:26+08:002019-06-21T06:19:26+08:00

    Como você disse que está usando dimensionamento automático de cluster, vou presumir que o pod está sendo removido porque o cluster está sendo dimensionado. Vimos um problema semelhante porque estamos executando tarefas de transcodificação de vídeo usando um 0- pool de nós dimensionado (que é expandido à medida que os trabalhos são adicionados).

    Olhando para ele, encontramos a documentação do autoescalador sobre o autoescalador e, em seguida, modificamos nossos trabalhos de acordo:

    Quais tipos de pods podem impedir que a CA remova um nó?

    • Pods com PodDisruptionBudget restritivo.

    • Pods do sistema Kube que:

      • não são executados no nó por padrão, *
      • não tem um orçamento de interrupção de pod definido ou seu PDB é muito restritivo (desde CA 0.6).

    Pods que não são apoiados por um objeto controlador (portanto, não criados por implantação, conjunto de réplicas, trabalho, conjunto com informações de estado, etc.). *

    Pods com armazenamento local. *

    Pods que não podem ser movidos para outro lugar devido a várias restrições (falta de recursos, seletores de nó não correspondentes ou afinidade, antiafinidade correspondente etc.)

    Pods com o seguinte conjunto de anotações: "cluster-autoscaler.kubernetes.io/safe-to-evict": "false"

    Foi o último que fez o truque para nós. Eu recomendo usar isso como ponto de partida.

    • 1

relate perguntas

  • Instalador do Google Cloud SDK - Falha ao descompactar para Windows Installer

  • Excluir rede padrão do google cloud

  • Como usar o módulo Ansible k8s?

  • Local de hospedagem do Firebase

Sidebar

Stats

  • Perguntas 205573
  • respostas 270741
  • best respostas 135370
  • utilizador 68524
  • Highest score
  • respostas
  • Marko Smith

    O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

    • 5 respostas
  • Marko Smith

    Como faço para ativar o WindowsXP agora que o suporte acabou?

    • 6 respostas
  • Marko Smith

    Área de trabalho remota congelando intermitentemente

    • 7 respostas
  • Marko Smith

    Serviço do Windows 10 chamado AarSvc_70f961. O que é e como posso desativá-lo?

    • 2 respostas
  • Marko Smith

    O que significa ter uma máscara de sub-rede /32?

    • 6 respostas
  • Marko Smith

    Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

    • 1 respostas
  • Marko Smith

    O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

    • 8 respostas
  • Marko Smith

    Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

    • 5 respostas
  • Marko Smith

    ssl.SSLCertVerificationError: falha na verificação do certificado [SSL: CERTIFICATE_VERIFY_FAILED]: não foi possível obter o certificado do emissor local (_ssl.c:1056)

    • 4 respostas
  • Marko Smith

    Como posso saber em qual unidade o Windows está instalado?

    • 6 respostas
  • Martin Hope
    Albin Como faço para ativar o WindowsXP agora que o suporte acabou? 2019-11-18 03:50:17 +0800 CST
  • Martin Hope
    fixer1234 O "HTTPS Everywhere" ainda é relevante? 2019-10-27 18:06:25 +0800 CST
  • Martin Hope
    Kagaratsch O Windows 10 exclui muitos arquivos minúsculos muito lentamente. Algo pode ser feito para agilizar? 2019-09-23 06:05:43 +0800 CST
  • Martin Hope
    andre_ss6 Área de trabalho remota congelando intermitentemente 2019-09-11 12:56:40 +0800 CST
  • Martin Hope
    Riley Carney Por que colocar um ponto após o URL remove as informações de login? 2019-08-06 10:59:24 +0800 CST
  • Martin Hope
    zdimension Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows? 2019-08-04 06:39:57 +0800 CST
  • Martin Hope
    Inter Sys Como Ctrl+C e Ctrl+V funcionam? 2019-05-15 02:51:21 +0800 CST
  • Martin Hope
    jonsca Todos os meus complementos do Firefox foram desativados repentinamente, como posso reativá-los? 2019-05-04 17:58:52 +0800 CST
  • Martin Hope
    MCK É possível criar um código QR usando texto? 2019-04-02 06:32:14 +0800 CST
  • Martin Hope
    SoniEx2 Altere o nome da ramificação padrão do git init 2019-04-01 06:16:56 +0800 CST

Hot tag

windows-10 linux windows microsoft-excel networking ubuntu worksheet-function bash command-line hard-drive

Explore

  • Início
  • Perguntas
    • Recentes
    • Highest score
  • tag
  • help

Footer

AskOverflow.Dev

About Us

  • About Us
  • Contact Us

Legal Stuff

  • Privacy Policy

Language

  • Pt
  • Server
  • Unix

© 2023 AskOverflow.DEV All Rights Reserve