技术解析

Manjaro(Arch) + KDE 频繁死机,有人遇到吗?如何诊断具体原因?
0
2021-06-29 08:35:56
idczone
滚动升级的 Manjaro + KDE,最近开始频繁死机。
部分时候是首先界面卡住,鼠标指针还能动,然后过一会儿就彻底不动了。此时短按电源键没用,只能长按强制关机。
也有不少情况下,直接就彻底失去响应了,没有界面冻住鼠标能动这一过程。

开始怀疑是过热,于是想了个办法(其实是自己写了个脚本),温度高于特定数值就降频。
脚本地址: https://github.com/metorm/MyTinyUtilities/blob/master/linux/script/thermal-protect.bash
把这个脚本开机自启之后,情况有所好转,但还是还是时有发生,我觉得可能不完全是硬件问题。

求问,这个情况,有人遇到过吗?或者,有没有人有过类似的情况,提供点诊断思路?
试着看看 systemd 有没有哪个 service 异常
https://wiki.archlinux.org/index.php/Systemd#Investigating_systemd_errors

个人感觉可能是显卡原因。贴一贴 log

看看 systemd 的日志有没有奇怪的错误
同时卡住时按 Ctrl + Alt + F2 切换到文本终端,看看哪个程序 CPU 占用高

谢谢各位,今天再重启的话我关注一下……

N 卡。你是怀疑显卡过热死了,所以输出图像的部分全挂掉了?

同 Manjaro KDE,没遇到你的问题
持续关注中。。

同 Manjaro KDE,我遇到的情况一般都是 chrome 突然卡死,或者锁屏后解锁时卡死。都是鼠标能动,但是界面没有反应,切到 tty 后发现,tty 也卡住了。也没有找到原因……

驱动没弄好,总会有玄学的问题

直接装的软件仓库里面的版本啊,算 CUDA 也好着呢,按理说不该是驱动……

下午又死了一次,确认 Ctrl + Alt + F2 无效
这么说的话,应该是真死了吧? @onlyice

有可能是卡到 Ctrl + Alt + F2 都进不去
不懂其他 debug 方式了。。

找到了疑似原因:
由于我是固态硬盘并且磁盘空间有点紧张。
我安装了 systemd-swap 软件包,并且开启了动态 swap 文件功能
swapfu_enabled=1
Swap File Universal
这个服务据说可以根据 swap 用量动态分配 swap 文件。然后,貌似这个不太稳定。
由于物理内存耗尽经常与高负载同时发生,所以我之前认为是过热导致的。
怀疑到这里,是因为前天我在虚拟机干活,为了虚拟机快一些,临时将虚拟机内存从 2G 增加到 4G (物理内存 8G ),并且在虚拟机之外开了 chrome 查资料。明明没什么负载,机器也刚打开不久,它就又死了,所以我怀疑跟内存相关。很容易联想到这里。关掉这个服务,使劲开 chrome 标签,内存耗尽后响应非常满,但是没有死。
于是卸掉这个软件,用了几天,再没有死机。
所以这个死机原因,就暂时可以认为是 systemd-swap 中 swapfu 功能的锅了。
@pipapa

赞楼主挖掘精神!

更新一下,从上次发帖到现在已经过了 9 天,没有一次死机,蛤蛤蛤~~~

数据地带为您的网站提供全球顶级IDC资源
在线咨询
专属客服