Flup提出的问题 -server

Flup

Asked: 2016-05-18 02:21:29 +0800 CST

Cisco UCS CPU falha ao mesmo tempo todos os dias

A situação

Atualização recente de 2.2 para 3.1(1e).
Desde a atualização, às 6h51 (UTC+1), todos os dias, tenho falhas entre zero e três (de aproximadamente 60) dos blades da série B200 em minha instalação.
São sempre as mesmas três lâminas, todas em chassis diferentes.
As falhas se manifestam como um hard hang com as mensagens 'Falha preditiva de CPU' e 'CATERR_N' no SEL.
Ligar e desligar o blade o restaura ao serviço (pelo menos até a próxima falha).
Não há programações únicas ou recorrentes no UCSM que estejam próximas a esta hora do dia.
O Cisco TAC está investigando, mas não esclarece por que as falhas acontecem no mesmo horário todos os dias.

Minha pesquisa e suspeitas

Eu tenho uma teoria de trabalho de que esses são problemas reais de hardware que de alguma forma foram expostos pela atualização do firmware.
Há uma breve menção de algo chamado 'gerenciador de varredura do sensor' no guia de solução de problemas , mas não consigo encontrar nenhum detalhe sobre o que ele faz ou como monitorá-lo.
Quase descartei uma causa ambiental. Nossos monitores de energia e temperatura não mostram nada incomum naquele momento. Não estamos em zona sísmica :-)

A questão

Por que as falhas estão acontecendo exatamente no mesmo horário todos os dias?

Flup

Asked: 2015-04-25 02:09:31 +0800 CST

Verificando a configuração exim gerada pelo fantoche antes de implantar

Eu uso o Puppet para gerar /etc/exim4.confe quero ter certeza de que a configuração é válida antes de instalar o arquivo em sistemas de produção.

Eu considerei—

usando um gancho git para chamarexim4 -bV -C filename ... mas isso não vai funcionar porque eu uso um modelo ERB para gerar o arquivo, então o resultado final não é realmente gerado até que o agente Puppet seja executado. Eu já tenho um git hook para testar a sintaxe do ERB.
deixando o script init verificar o arquivo de configuração ... mas isso não é bom o suficiente porque, embora o script se recuse a recarregar o Exim se a configuração for inválida, o arquivo já terá sido instalado e as chamadas diretas para o Exim (para enviar e-mail de aplicativos, por exemplo) falhará.

Idealmente, o que eu quero é algum tipo de diretiva Puppet que se pareça com

file { '/etc/exim4/exim4.conf':
    content => template("exim/etc/exim4/exim4.conf.erb"),
    notify => Service[exim4],
    but_before_we_install_check_syntax_with => '/usr/bin/exim4 -bV -C',
}

Como posso verificar a sintaxe do arquivo de configuração depois de gerado pelo Puppet, mas antes de ser instalado?

Estou usando Exim 4.80 e Puppet 2.7.26 em sistemas Debian Wheezy.

Cisco UCS CPU falha ao mesmo tempo todos os dias

Verificando a configuração exim gerada pelo fantoche antes de implantar

Você pode passar usuário/passar para autenticação básica HTTP em parâmetros de URL?

Ping uma porta específica

Verifique se a porta está aberta ou fechada em um servidor Linux?

Como automatizar o login SSH com senha?

Como posso dizer ao Git para Windows onde encontrar minha chave RSA privada?

Qual é o nome de usuário/senha de superusuário padrão para postgres após uma nova instalação?

Qual porta o SFTP usa?

Linha de comando para listar usuários em um grupo do Windows Active Directory?

O que é um arquivo Pem e como ele difere de outros formatos de arquivo de chave gerada pelo OpenSSL?

Como determinar se uma variável bash está vazia?

Flup's questions