技术解析

服务器提示有坏道,该怎么查是那块盘
0
2021-07-14 06:27:39
idczone

公司的ERP系统日志提示有坏块,在不影响ERP平台运行的情况下,Red Hat系统下怎么检测硬盘有没有坏道,做了raid的又如何准确的找出对应的盘呢?
本人对linux不是很懂,求v2好友帮忙,谢谢了。


直接看服务器的面板?raid检测出坏道,会有黄灯闪的。

erp还能提示坏道?

erp日志提示有坏块,就是不知道准不准,所有想检测下

smartctl 可以看很多raid逻辑卷下每个磁盘的状态,但你可能不习惯
LSI为例
MegaRAID有
megacli
storcli
LSI Fusion-MPT有
sas2ircu
hp就是hpacucli
areca也有cli64
intel应该是CmdTool2
lspci看品牌看芯片,找cli即可
软raid
mdadm或着raidz就用系统命令看即可

对于这种情况
我建议楼主趁春节期间加个班,申请把服务停一下。
然后直接用阵列自带的工具进行报告收集,然后把结果发回厂商。

先备份重要数据,不然就多准备两包纸巾。。。哭的时候用

机器不太老还好,碰到太老的机器,停机了能不能再次开起来还是个未知数 :D

印象中IBM DELL HP的服务器都有工具可用看硬盘的。
还是早点备份数据吧

看卡,有些卡是提供工具软件的,可以直接查得出诊断日志,交给厂商分析就可...(我去年底有查过Dell的,LSI的卡,Dell工程师给了个工具,RPM包,Debian下装了RPM支持,就可了,诊断工具,得出日志,交Dell的人分析,完事。自己看也看的出,诊断日志里有明确告诉你哪块硬盘不正常的)。

只有脱机了,才亮灯吧?坏道这种的应该不会亮吧

目前应该是轻微的坏道还没到整个硬盘不工作

只要单块盘的S.M.A.R.T有异常,就会亮灯。至少单位的IBM X3650 X3850都是这样的。。

badblocks 这个系统命令不知如何

确实,开了5,6年的机器都不敢关,就怕再开不起来。。。

1,马上找一块硬盘做对拷备份。
2,关机,换好的硬盘上去,开机。继续跑业务。
3,修硬盘。
为啥?因为与其让一个完全没问题的硬件在线上,也绝对不能让可能有问题的硬件在线上。
否则,迟早有一天定时炸弹爆炸。
LZ现在的做法就是看着定时炸弹不敢拆。。。

千万别想当然。。除非你对硬件了如指掌。。。这可是定时炸弹。。
以前我们公司硬盘就是出了点小问题,没管。然后某一天,系统崩溃,起不来了。做了raid硬盘全部熄火。
损失惨重,大量业务数据恢复,费事费力。。


为什么那些老机器重启之后就起不来了呢?

连续运行几年的服务器,关机再开会出现各种意想不到的问题。。。参见7楼兄弟的正解

数据地带为您的网站提供全球顶级IDC资源
在线咨询
专属客服