Instalador do Google Cloud SDK - Falha ao descompactar para Windows Installer

Question

should_be_working

Asked: 2019-06-18 07:06:46 +0800 CST2019-06-18 07:06:46 +0800 CST 2019-06-18 07:06:46 +0800 CST

Kubernetes um trabalho é movido para outro pod

772

Um trabalho de execução longa (45h) é movido para outro pod, fazendo com que seja reiniciado.

Nos logs, posso ver que o trabalho recebeu um SIGTERM e foi reiniciado em outro pod e provavelmente em outro nó também.

As informações recuperadas no google cloud não estão ajudando. As páginas Yamlou eventsnão descrevem este evento, exceto para a criação do pod.

O trabalho YamlcreationTimestamp: 2019-06-15T10:39:25Z

A cápsula YamlcreationTimestamp: 2019-06-17T13:26:25Z

Eu uso principalmente uma configuração padrão 1.12.6-gke.11com vários nós e os servidores não são preemptivos.

É um comportamento padrão do k8s? Se for, como posso desativá-lo?

1 respostas

Voted

ProgrammingLlama · Answer 1 · 2019-06-21T06:19:26+08:00

Como você disse que está usando dimensionamento automático de cluster, vou presumir que o pod está sendo removido porque o cluster está sendo dimensionado. Vimos um problema semelhante porque estamos executando tarefas de transcodificação de vídeo usando um 0- pool de nós dimensionado (que é expandido à medida que os trabalhos são adicionados).

Olhando para ele, encontramos a documentação do autoescalador sobre o autoescalador e, em seguida, modificamos nossos trabalhos de acordo:

Quais tipos de pods podem impedir que a CA remova um nó?

Pods com PodDisruptionBudget restritivo.

Pods do sistema Kube que:

não são executados no nó por padrão, *

não tem um orçamento de interrupção de pod definido ou seu PDB é muito restritivo (desde CA 0.6).

Pods que não são apoiados por um objeto controlador (portanto, não criados por implantação, conjunto de réplicas, trabalho, conjunto com informações de estado, etc.). *

Pods com armazenamento local. *

Pods que não podem ser movidos para outro lugar devido a várias restrições (falta de recursos, seletores de nó não correspondentes ou afinidade, antiafinidade correspondente etc.)

Pods com o seguinte conjunto de anotações: "cluster-autoscaler.kubernetes.io/safe-to-evict": "false"

Foi o último que fez o truque para nós. Eu recomendo usar isso como ponto de partida.

Kubernetes um trabalho é movido para outro pod

O visualizador de fotos do Windows não pode ser executado porque não há memória suficiente?

Como faço para ativar o WindowsXP agora que o suporte acabou?

Área de trabalho remota congelando intermitentemente

Serviço do Windows 10 chamado AarSvc_70f961. O que é e como posso desativá-lo?

O que significa ter uma máscara de sub-rede /32?

Ponteiro do mouse movendo-se nas teclas de seta pressionadas no Windows?

O VirtualBox falha ao iniciar com VERR_NEM_VM_CREATE_FAILED

Os aplicativos não aparecem nas configurações de privacidade da câmera e do microfone no MacBook

ssl.SSLCertVerificationError: falha na verificação do certificado [SSL: CERTIFICATE_VERIFY_FAILED]: não foi possível obter o certificado do emissor local (_ssl.c:1056)

Como posso saber em qual unidade o Windows está instalado?

Kubernetes um trabalho é movido para outro pod

1 respostas

relate perguntas