首页 / LINUX / 调试Linux机器死机
调试Linux机器死机
内容导读
互联网集市收集整理的这篇技术教程文章主要介绍了调试Linux机器死机,小编现在分享给大家,供广大互联网技能从业者学习和参考。文章包含1307字,纯文字阅读大概需要2分钟。
内容图文
我有15个相同的Linux RH 4.7 64位服务器.它们运行集群数据库(集群是应用程序级别).有时(每个月左右)一个随机的盒子(虽然从来没有相同)冻结.
我可以ping这个盒子并ping工作.如果我尝试在框中ssh我得到:
ssh_exchange_identification: Connection closed by remote host
SSH设置正确.
当我进入服务器机房,并尝试直接登录到控制台时,我可以使用Alt Fn切换控制台,我可以输入用户名,字符确实显示,但按Enter键后,没有任何反应.我等了8个小时,但没有改变.
我设置syslog将所有内容记录到远程主机,这些日志中没有任何内容.当我重新启动机器时,它没有问题.我已经运行了硬件测试 – 一切正常,日志中没有任何内容.这些机器也使用NAGIOS进行监控,并且在冻结之前没有异常的负载或活动.
我已经没有想法;我还能做什么或检查?
解决方法:
听起来你的内核以某种方式惊慌失措,以至于sshd无法发送服务器密钥.可能,内核被楔入,网络堆栈仍然处于运行状态,但vfs层不可用.
当我在RHEL4系统上遇到类似问题时,我设置了netdump and netconsole services,以及专用的netdump和syslog服务器来捕获故障转储和内核崩溃信息.我还将kernel.panic sysctl设置为10.这样,当系统发生混乱时,您将获得内核跟踪和该系统上的内存副本,您可以使用’crash’实用程序对其进行分析.
您当然也可以从为主机设置串行控制台中受益,因此您可以看到控制台输出并可能触及魔术sysrq键.此外,如果您愿意设置网络并且您拥有支持它的硬件,则可以使用IPMI远程关闭,打开电源,重新启动和查询硬件.
(对于它的价值,RHEL5与kexec / kdump具有类似的功能,只有崩溃转储存储在本地)
内容总结
以上是互联网集市为您收集整理的调试Linux机器死机全部内容,希望文章能够帮你解决调试Linux机器死机所遇到的程序开发问题。 如果觉得互联网集市技术教程内容还不错,欢迎将互联网集市网站推荐给程序员好友。
内容备注
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 gblab@vip.qq.com 举报,一经查实,本站将立刻删除。
内容手机端
扫描二维码推送至手机访问。