使用 Checkmk 监控管理面板

马丁·赫希沃格 2024年1月19日

阅读时间 3 分钟

在错综复杂的数据中心和服务器管理世界中,管理面板(又称基板管理控制器)确保了关键基础设施的平稳运行和可靠性。管理面板是嵌入在服务器主板上的专用控制器,在远程管理和监控方面发挥着关键作用。从本质上讲,管理板是服务器的守护者,允许管理员控制和监督硬件的各个方面,即使在安装的操作系统处于离线状态时也是如此。根据供应商的不同,管理板可能被称为 BMC、ILO、IMM或iDRAC。

管理板可提供有关裸机服务器基本硬件和外围设备的信息,包括:

  • 中央处理器(CPU)
  • 内存模块
  • 网络端口
  • PCI 总线
  • 风扇
  • 电源、功耗和稳压器
  • Raid 控制器
  • 驱动器/磁盘
  • 温度传感器

这些信息对于全面监控服务器以检测硬件故障等至关重要。

如何监控管理面板

通常,管理面板可通过智能平台管理接口(IPMI)或简单网络管理协议(SNMP)提供数据——Checkmk直接支持这两种方式。

我们建议通过以下方式将管理面板作为专用主机进行监控:

1. 配置主机属性的 SNMP。

2. 通过 Freeipmi 或 IPMItool 配置 IPMI 传感器,并将其分配给该主机。

结合管理面板和操作系统监控

虽然目前在技术上可以将管理面板直接附加到主机上,但这种做法很快就会被淘汰。虽然这种做法可以让管理面板和操作系统的信息在同一台主机上显示。不过,这也有几个缺点:

  • 管理面板在逻辑上完全独立于已安装的操作系统。也就是说,你可以重启操作系统,而无需重启管理面板,反之亦然。或者用监控术语来说: 其中一个可以处于 “关机 ”状态,而另一个则处于 “开机 ”状态。
  • 与集成的管理面板部分相比,对专用主机进行微调更简单,功能也更强大。例如,假设您通过SNMP监控管理面板,而设备的 SNMP 协议栈性能不佳,那就可能需要更长的检查时间间隔。即时基于代理的主机可能不要求增加检查间隔,但您也必须这样做。

我们理解在 Checkmk 中整合相关信息的需要。现在,您已经可以通过 Checkmk 功能强大的仪表盘和查看选项整合两个专用主机(一个用于管理面板,一个用于操作系统)。我们计划在未来的用户界面中提供一种流畅、自动的方式来整合这两个数据源。