起因
客户有一台华为 RH8100的服务器面板告警灯亮,需要进BMC确认具体告警信息,但是这台设备没有接入带外管理网络,而默认的管理口IP还被已离职的前任运维改了,且没有记录。
一般这种没有前置LED屏的服务器,可以去BIOS里面查看和更改管理口IP,但是这台服务器上面现在有在运的业务,而面板只是告警,暂时还没影响业务,所以肯定没法停掉业务重启服务器进BIOS去查看管理IP。
这种情况属实是还没碰到过,因为查了下服务器已经过保了,也没有在保的SN能用来代替咨询,只能自己摸索尝试下。
尝试解决
然鹅尝试失败了,可以跳到#最终解决方案
在服务器后面看到了有串口,随即翻了下官方文档,发现确实是可以用串口访问命令行管理,但是需要先在BMC里面先将串口由“系统串口”模式切换为“iBMC串口”模式……
看到这里已经感觉没啥希望了,抱着试一试不要钱的心态试了下,果然不行……
这下只能自个找方法解决了
思路1:ARP
依稀记得ARP会在二层广播自己的IP地址,就拉了台笔记本去直连管理口。
提前打开wireshark挂着抓包,然后就接上了网线,稍微等了一下,先用arp命令看了下arp表,可惜没啥信息。
把期望放在了wireshark上,翻了寥寥无几的几个ARP包,然而都是本机发出的,压根没看到对端发出的包,也不知道是底层把目标非本机IP的ARP包给丢弃了,还是管理口本身就没有向外发包。
思路2:IPv6 DHCP
又想起通常情况下,这类网口默认情况下应该都是启用IPv6,并且是DHCP模式的。
这样如果让服务器管理口通过DHCP获取到分配的IPv6地址,就能直接用IPv6访问BMC了。
立马给电脑装了个dnsmasq,并把地址池仅限1个IP,接上管理口就直接开启DHCP。
结果是满怀希望地开始尝试,但还是失败了,估摸着是IPv6被关掉了。
最终解决方案
最终没辙了,打电话给官方客服看看能不能白嫖到个技术支持,因为客户的单位还蛮大的,这个可能性还是有的。
果不其然,客服说原则上过保的设备他们不提供技术服务的,但是因为客户单位是重点客户,可以提供一下有限的技术支持,不过风险自行承担。
顺带一提,华为RH8100这个机型已经移交超聚变公司管理了,所以应该直接找超聚变的客服。
把情况跟技术支持客服一说之后,他也表示这种情况很为难,就先挂了电话,说去找下有没有办法,找到再回我邮件。
也没等多久,第二天就给我回了解决方案。
ipmitool
具体方法就是在操作系统上安装ipmitool工具查看它本机的BMC信息。
技术客服给我发的是ipmitool的源码压缩包,不过CentOS本身软件仓库上就有现成的工具,直接包管理器安装就行了。
# 安装ipmitool |