linux – 如何诊断ubuntu服务器重启

linux – 如何诊断ubuntu服务器重启
我的ubuntu服务器(12.04)有时会在没有通知的情况下重启.如何检查触发服务器重启的内容?

这是一门艺术.

如果可以,启用串行控制台(您需要BIOS支持,可能需要启用GRUB支持,并运行TTY),并确保syslog和内核写入控制台.将此捕获到另一个服务器上的文件的屏幕会话可能很有用.

通常的日志怀疑:/ var / log / messages,/ var / log / syslog,/ var / log / kernel.log,/ var / log / debug.请注意,/ var / log / dmesg仅在引导后立即捕获内核环缓冲区,因此可能不会有太多信息.

最有用的事情之一是启用netconsole,一种内核内日志记录服务.您需要一个系统日志服务器(最好是附近)来捕获输出.假设数据可以安全地记录到磁盘,kdump也很有用.

如果您仍然难过,请开始查看硬件组件(内存,CPU和主板组件是主要问题),更换/禁用其中的部分或全部内容等.内核驱动程序可能会导致故障,因此加载/卸载模块可能会显示的东西.

BIOS配置可能会产生问题.例如:几年前戴尔发布了“CSTATE”设置问题,英特尔在北门/南门配置方面有一个问题.请咨询您的BIOS /系统供应商,了解任何建议的设置或固件更新.

多年来,由于电容器坏,RAM坏,BIOS,samba驱动程序,硬件加密加速器,电源/分配元件,主板接线,主电源中断以及各种形式的运算符错误/干预,我发生了随机锁定/崩溃.通常,从简单/可记录的东西开始,并开始从可能的候选者中删除组件(硬件或软件).

推荐阅读