近期有同事反馈部分机器中kipmi0 占用cpu100%的情况,整理了以下相关资料共大家参考
ipmi是OS与BMC通讯的服务,kipmi0进程占用CPU 100% 是OS的驱动与BMC交互出现了问题,并且这个状态下ipmi的操作也没有响应。但是kipmi0进程优先级很低,当有系统应用需要CPU资源时,kipmi0会释放资源。案例:一台机器在看上周出现kipmi0占用CPU 100%的机器已经恢复正常,我这边没有对机器有任何操作,kipmi0自己释放出了资源。 解决方法: 尝试重启ipmi服务 service ipmi restart,如果重启无效或者命令hang住可以尝试以下方法。 1、 简单处理 echo 100 > /sys/module/ipmi_si/parameters/kipmid_max_busy_us 执行之后可临时降低使用率kipmi0的CPU使用率 2、 编辑/etc/modprobe.conf 添加options ipmi_si force_kipmid=0 (需要重启生效) 3、 编辑/etc/grub.conf 添加ipmi_si.kipmid_max_busy_us=<time in microseconds> (参考值 100 需要重启生效) 后续考虑将此操作加入初始化。 参考链接https://access.redhat.com/solutions/21322
|