dr.pooter Asked: 2009-06-19 14:16:21 +0800 CST2009-06-19 14:16:21 +0800 CST 2009-06-19 14:16:21 +0800 CST NOC 态势感知 772 在我们的 NOC 中,我们保持对所有物理安全区域(反应视频源)的态势感知、有关数据中心物理特征的一些基本信息、天气和国家新闻源。您是否还有其他推荐 NOC 显示器的东西,或者这是否足够好。 datacenter analytics 5 个回答 Voted Best Answer sh-beta 2009-06-19T14:37:55+08:002009-06-19T14:37:55+08:00 这是一个相当广泛的问题,但我假设我们正在避免服务或逻辑级别的监控(即 SSH 侦听、网站正确响应、磁盘空间、CPU 使用率等)。 您的 NOC 应该同时进行持续的不干预监控以及定期的手动/注视监控。 持续监控: 来自数据中心多个传感器的环境温度/湿度 数据中心所有电路的功耗 交流单元的自我报告负载/健康状况 数据中心内部、所有数据中心入口和 NOC 区域入口的视频源 UPS电池状态 记录数据中心的所有入口/出口(无论是刷卡还是手动登录) 交换机端口/路由器接口状态事件(上/下/速度变化) 定期演练: 机架关闭并锁定 任何声音或视觉硬件警报(灯、音、状态 LCD) 地砖到位且状况良好 数据中心入口关闭并上锁 相机不受干扰 数据中心内或周围没有意外访客 故障的灯、破碎的窗户、损坏的门,以及任何使物理安全更容易被破坏的东西 另外,为什么要打扰国家新闻提要?除非您的数据中心分布在全国各地,否则收听当地新闻台会更有意义。不过,这作为一个整体的价值是值得怀疑的,因为它将是一个非常高的噪声:信号比。如果有的话,只需订阅相关新闻媒体的 RSS 提要。 最后,这可能不是您想要的,但我发现在我的网络之外进行测试是非常宝贵的。使用小型和大型数据包测试几个知名网络(Google、Yahoo、Microsoft 等)的高延迟或数据包丢失,检查常见网站的正确返回代码,并测量往返几个流行免费邮件的电子邮件的往返延迟网站(雅虎、Hotmail、Gmail)在我的用户开始打电话之前让我解决了几个微妙的问题。 cji 2009-06-19T14:34:44+08:002009-06-19T14:34:44+08:00 Securitywizardry.com 提供的雷达一直是我想在 NOC/SOC 中放置一个大等离子的东西,因为它很酷:http ://www.securitywizardry.com/radar.htm 它包括安全新闻、“健康”级别、新出现的威胁和有关工具更新的信息。 SpaceManSpiff 2009-06-20T05:56:57+08:002009-06-20T05:56:57+08:00 我的想法是了解事物的物理方面。 经常走动,如果您在现场和 24/7 办公室,那么在轮班开始时让 2 人分开走动。如果他们一起走,他们只会聊天,看不到他们应该看到的东西。 如果不在现场,请尝试由员工或聘请当地承包商进行定期步行。 我会说每周分钟,但每天更好。 如果那里有任何液体管道(HVAC 冷却器管道、生活用水管道、您上方浴室的污水等),请更频繁地执行此操作 寻找不合适的地方 滴水管可以在电子传感器之前被人眼捕捉到 检查地板下 感受 HVAC 通风口以确保它们打开 听 UPS 的。如果他们嗡嗡声响亮那么正常,您可能会检查一下 你拥有的任何变压器也是如此 闻,那里有很多电子产品要开始煎炸 保持干净 如果您有单独的发电机/杂物间,也请检查一下 确保燃油管路没有泄漏 保持干净 噪音和气味 如果发电机正在进行自动测试,请在测试后检查它,确保没有任何泄漏。 每年对您的电气面板进行几次热扫描并不是一个坏主意。这将发现接近故障的齿轮,因为它会显得更热。 每一次失败都是从小的开始,如果你在小时候发现它,你可以按照你的时间表修复 l0c0b0x 2009-06-19T14:31:41+08:002009-06-19T14:31:41+08:00 怎么样: NOC 工作人员 RSS 提要/推文 NOC 的每个人如何共享信息?Yammer ( https://www.yammer.com/ ) 可能是共享企业范围的信息/状态(通过电子邮件/IM/RSS)的好方法。 duffbeer703 2009-06-19T14:21:24+08:002009-06-19T14:21:24+08:00 内部或外部事件的 RSS 提要可能很有用。我们使用内部博客进行更改控制,并将输出通过 RSS 阅读器屏幕保护程序传输到 Mac。
这是一个相当广泛的问题,但我假设我们正在避免服务或逻辑级别的监控(即 SSH 侦听、网站正确响应、磁盘空间、CPU 使用率等)。
您的 NOC 应该同时进行持续的不干预监控以及定期的手动/注视监控。
持续监控:
定期演练:
另外,为什么要打扰国家新闻提要?除非您的数据中心分布在全国各地,否则收听当地新闻台会更有意义。不过,这作为一个整体的价值是值得怀疑的,因为它将是一个非常高的噪声:信号比。如果有的话,只需订阅相关新闻媒体的 RSS 提要。
最后,这可能不是您想要的,但我发现在我的网络之外进行测试是非常宝贵的。使用小型和大型数据包测试几个知名网络(Google、Yahoo、Microsoft 等)的高延迟或数据包丢失,检查常见网站的正确返回代码,并测量往返几个流行免费邮件的电子邮件的往返延迟网站(雅虎、Hotmail、Gmail)在我的用户开始打电话之前让我解决了几个微妙的问题。
Securitywizardry.com 提供的雷达一直是我想在 NOC/SOC 中放置一个大等离子的东西,因为它很酷:http ://www.securitywizardry.com/radar.htm
它包括安全新闻、“健康”级别、新出现的威胁和有关工具更新的信息。
我的想法是了解事物的物理方面。
经常走动,如果您在现场和 24/7 办公室,那么在轮班开始时让 2 人分开走动。如果他们一起走,他们只会聊天,看不到他们应该看到的东西。
如果您有单独的发电机/杂物间,也请检查一下
每年对您的电气面板进行几次热扫描并不是一个坏主意。这将发现接近故障的齿轮,因为它会显得更热。
每一次失败都是从小的开始,如果你在小时候发现它,你可以按照你的时间表修复
怎么样:
NOC 工作人员 RSS 提要/推文
NOC 的每个人如何共享信息?Yammer ( https://www.yammer.com/ ) 可能是共享企业范围的信息/状态(通过电子邮件/IM/RSS)的好方法。
内部或外部事件的 RSS 提要可能很有用。我们使用内部博客进行更改控制,并将输出通过 RSS 阅读器屏幕保护程序传输到 Mac。