Os usuários não conseguem acessar seus e-mails, o CEO não consegue acessar a página inicial da empresa e seu pager acabou de disparar com um código "911". O que você faz quando tudo explode?
Os usuários não conseguem acessar seus e-mails, o CEO não consegue acessar a página inicial da empresa e seu pager acabou de disparar com um código "911". O que você faz quando tudo explode?
Fique calmo
Não surte. Respirar! (A partir do diafragma, isso ajuda.) Se você estudou meditação, isso também pode ajudar.
Quando confrontado com estresse extremo, seu corpo entra em um modo de fuga ou luta, porque seu corpo pensa que está em uma situação de vida ou morte. Nesse momento, seu corpo vai bombear menos sangue para algumas partes do cérebro, diminuindo funções como o raciocínio. Isso efetivamente reduz seu QI, pois o instinto, em vez da racionalidade, começa a dominar suas funções cerebrais. Se você já esteve ou testemunhou uma discussão acalorada, pode reconhecer esses sintomas quando as emoções das pessoas se inflamam e a racionalidade tira férias. Mais tarde, quando as pessoas tiverem a chance de se acalmar, estarão mais propensas a aceitar ter cometido um erro ou errado, e são mais capazes de ver o outro lado, mas no calor do momento, menos.
Manter a compostura e manter o juízo sobre você manterá seu cérebro funcionando em plena capacidade e garantirá que você tome decisões racionais com base em evidências e razão, em vez de emoção e medo.
Triagem
A aplicação eficiente de recursos limitados para obter o maior benefício com o menor custo é extremamente importante aqui. Tome as decisões o mais cedo possível sobre quais coisas devem ser consertadas AGORA, quais podem esperar um pouco (horas, dias) e quais podem esperar indefinidamente. Aprenda também a perceber quando algo é irrecuperável e não vale a pena salvar (por exemplo, metade do roteador derreteu, mesmo que seja o único, você não pode salvá-lo, compre um novo e coloque-o no local rapidamente ou encontre algo que possa preencher a lacuna temporariamente).
Manter Consciência Situacional
Não permita que sua atenção seja aprisionada por algum problema interessante ou por algo que você ainda não entende muito bem. Mantenha o foco no quadro geral e em fazer as coisas mais importantes funcionarem.
Use o Método Científico
Forme uma hipótese. Determine como você testaria essa hipótese. Reúna dados para testar a hipótese. Procure também dados que não confirmem. Refine sua hipótese e repita o ciclo quantas vezes for necessário até ter confiança suficiente em sua hipótese para agir.
Seja pragmático
Agora não é hora para dogmas. Não há problema em pegar alguns atalhos aqui e ali ao se recuperar de um desastre. Isso é essencialmente acumular dívida técnica. Em muitas empresas, uma falha catastrófica significa uma perda catastrófica de receita. É melhor fazer as coisas funcionarem, mesmo que com uma base instável, do que perder tempo e arriscar o sustento de sua empresa. Como sempre, o julgamento é extremamente importante aqui. Às vezes faz sentido sustentar um ventilador de caixa apontado para um rack de servidor, às vezes não.
Cuide de si mesmo
Há quanto tempo você está trabalhando nesta emergência? Quando foi a última vez que você bebeu água? Quando foi a última vez que você comeu? Há quanto tempo você está acordado? Não se esgote só porque há uma emergência, reserve um tempo para se manter hidratado, alimentado e descansado (no caso de ser um trabalho árduo de vários dias).
Recrutar ajuda
É quase certo que existem muitas pessoas talentosas em sua empresa que são motivadas e capazes de oferecer ajuda. Tenha cuidado para não deixar muitas pessoas correndo e causando problemas umas para as outras. Também tenha cuidado para não irritar as pessoas, colocando-as em um "exercício de fogo". Encontre pessoas que já desejam ajudar, coloque-as para trabalhar em tarefas específicas e certifique-se de que as pessoas estejam se comunicando umas com as outras.
Comunicar
A comunicação é crítica. Nada é tão assustador quanto o desconhecido. Quando as pessoas não sabem nada além de que algo está quebrado, uma declaração vazia de que estará de volta em X horas é apenas levemente reconfortante (ainda menos reconfortante depois que X horas se passaram e as coisas ainda estão quebradas). As pressões em jogo podem levá-lo a fornecer estimativas de tempo WAG excessivamente otimistas, mas esse é o caminho errado. Não diga apenas que está trabalhando nisso, não diga apenas que as coisas serão corrigidas em X tempo. Esteja aberto, mostre seu processo, detalhe seu progresso e seus contratempos. Forneça informações sobre o problema, seu processo para rastreá-lo e seu plano para consertar as coisas (embora não afogue as pessoas em minúcias). Mostre que o problema não é intratável, mostre que as coisas serão corrigidas eventualmente, mostre que existem pessoas competentes no problema,
A primeira resposta é fique calmo! Aprendi da maneira mais difícil que entrar em pânico muitas vezes só piora as coisas. Uma vez que isso é alcançado, a próxima coisa é realmente verificar qual é o problema. Reclamações de usuários e gerentes chegarão até você de todos os ângulos, dizendo o que ELES não podem fazer, mas não qual é o problema.
Depois de conhecer o problema, você pode iniciar o plano para corrigi-lo e começar a dar aos seus usuários irritados uma escala de tempo!
Não entrar em pânico.
Passo 0. Verifique se não é o seu sistema de monitoramento que está com defeito
Reserve imediatamente um voo para um país não-extradição
faça login no serverfault
Verifique o básico primeiro, parece bobo, mas coisas como
Eu sei que muito tempo pode ser perdido procurando uma solução quando o problema é upstream
Eu ping coisas. O que acontece depois disso varia muito, dependendo dos resultados do ping.
Desculpe, mas esta pergunta já está perfeitamente respondida no desenho animado do administrador de sistema favorito :
Culpe a rede.
(é uma piada!)