沟通至关重要。没有什么比未知更可怕。当人们只知道某件东西坏了,一个空洞的声明说它会在 X 小时内恢复,这只是稍微让人放心(在 X 小时过去并且事情仍然坏了之后更让人不放心)。发挥作用的压力可能会引导你给出过于乐观的 WAG 时间估计,但这是错误的做法。不要只是说你正在努力,不要只是说事情会在 X 时间之前修复。保持开放,展示你的过程,详细说明你的进步和挫折。提供对问题的洞察力、追踪问题的过程以及解决问题的计划(尽管不要让人们陷入细枝末节)。表明问题不是棘手的,表明事情最终会得到解决,表明有能力解决这个问题,
保持冷静
不要惊慌失措。呼吸!(从横膈膜开始,它会有所帮助。)如果你研究过冥想,那也会有所帮助。
当面临极端压力时,你的身体会进入逃跑或战斗模式,因为你的身体认为它处于生死攸关的境地。此时,您的身体实际上会减少向大脑某些部位输送的血液,从而减少推理等功能。这有效地降低了你的智商,因为本能而不是理性开始主宰你的大脑功能。如果您曾经参与或目睹过激烈的争论,您可能会在人们情绪爆发和理性休假时认出这些症状。后来,当人们有机会冷静下来时,他们会更容易接受自己犯了错误或犯了错误,并且更有能力看到另一面,但在当下火热的时候,就不太可能了。
保持镇定并保持对自己的机智将使您的大脑充分发挥作用,并确保您根据证据和理性而不是情绪和恐惧做出理性的决定。
分诊
有效地应用有限的资源以最低的成本获得最大的收益在这里是非常重要的。尽早决定哪些事情必须立即修复,哪些可以等待一段时间(几小时,几天),哪些可以无限期地等待。还要学会意识到什么时候无法挽救并且不值得保存(例如一半的路由器融化了,即使它是你唯一的,你也无法保存它,买一个新的并在现场匆忙得到它或找到可以暂时填补空白)。
保持态势感知
不要让你的注意力被一些有趣的问题或你还不太了解的东西所困。继续关注大局,让最重要的事情发挥作用。
使用科学方法
形成一个假设。确定你将如何检验这个假设。收集数据以检验假设。寻找不证实的数据。完善您的假设并根据需要重复该循环多次,直到您对自己的假设有足够的信心采取行动。
务实
现在不是教条的时候。从灾难中恢复时,可以在这里和那里走一些捷径。这实质上是在积累技术债务。在许多公司,灾难性的失败意味着灾难性的收入损失。让事情运转起来,即使是在摇摇欲坠的基础上,也比磨磨蹭蹭和冒着公司生计的风险要好。与往常一样,判断在这里至关重要。有时支撑一个指向服务器机架的箱式风扇是有意义的,有时则不然。
照顾自己
你为这个紧急情况工作了多久?你最后一次喝水是什么时候?你最后一次吃东西是什么时候?你醒了多久?不要仅仅因为有紧急情况而让自己筋疲力尽,花时间保持水分、进食和休息(以防它是一个漫长的、多天的工作)。
招聘帮助
几乎可以肯定,您的公司中有很多才华横溢的人,他们既有积极性又有能力提供帮助。不过要小心不要让太多人到处乱跑,给彼此造成麻烦。还要通过“消防演习”来提防烦人的人。找到已经想提供帮助的人,让他们从事有针对性的任务,并确保人们相互交流。
交流
沟通至关重要。没有什么比未知更可怕。当人们只知道某件东西坏了,一个空洞的声明说它会在 X 小时内恢复,这只是稍微让人放心(在 X 小时过去并且事情仍然坏了之后更让人不放心)。发挥作用的压力可能会引导你给出过于乐观的 WAG 时间估计,但这是错误的做法。不要只是说你正在努力,不要只是说事情会在 X 时间之前修复。保持开放,展示你的过程,详细说明你的进步和挫折。提供对问题的洞察力、追踪问题的过程以及解决问题的计划(尽管不要让人们陷入细枝末节)。表明问题不是棘手的,表明事情最终会得到解决,表明有能力解决这个问题,
第一个答案是保持冷静!我了解到,恐慌往往只会让事情变得更糟。一旦实现了这一点,接下来的事情就是实际确定问题所在。来自用户和管理者的抱怨会从各个角度向你倾诉,告诉你他们不能做什么,而不是问题是什么。
一旦你知道了问题,你就可以开始计划解决它并开始给你愤怒的用户一个时间表!
不要恐慌。
第 0 步。检查是否有问题不是您的监控系统
立即预订飞往非引渡国的航班
登录到服务器故障
首先检查基础知识,这看起来很傻,但是像
我知道当问题出现在上游时,可能会浪费大量时间寻找解决方案
我ping东西。之后发生的事情因 ping 的结果而异。
抱歉,这个问题已经在最喜欢的系统管理员卡通中得到了完美的回答:
责怪网络。
(这是个笑话!)