使用smartmontools查看SSD的寿命

2024-03-06 01:44

本文主要是介绍使用smartmontools查看SSD的寿命,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 前言
  • 一、smartmontools是什么?
  • 二、下载
  • 三、使用
    • 1.SATA&NVME
      • 1.建兴
      • 2.金士顿
      • 3.Intel SSD
      • 4.西数
      • 5.铠侠
      • 6.三星
      • 7.影驰
    • 2.RAID
      • 1.MegaRAID
      • 2.PERC
      • 3.浪潮PM8204-2G
      • 4.AacRaid
      • 5.3ware RAID
      • 6.Areca SATA RAID
      • 7.cciss RAID
  • 总结


前言

硬盘已经成为生活中的必需品了,小到家里的PC,大到公司的服务器处处离不开硬盘。没有人希望突然有一天电脑开不了机,原因竟然是硬盘损坏。虽然有时候硬盘损害前可能有一些先兆,不排除人也有大意的时候。这个时候,监控硬盘健康度就显得很重要了,至少不会让重要的数据惨遭厄运。硬盘损坏是我的亲身经历,现在想起来还痛心疾首!


一、smartmontools是什么?

The smartmontools package contains two utility programs (smartctl and smartd) to control and monitor storage systems using the Self-Monitoring, Analysis and Reporting Technology System (SMART) built into most modern ATA/SATA, SCSI/SAS and NVMe disks. In many cases, these utilities will provide advanced warning of disk degradation and failure.

一言以蔽之,检测硬盘SMART信息的工具。

二、下载

Ubuntu自带这个包,只需要使用apt安装即可,这一步没什么好说的。

sudo apt update
sudo apt install smartmontools

三、使用

我们要使用的就是这个工具smartctl,基本都是围绕着它来进行的。这里要分很多种情况,如果你的SSD是直接介入到SATA控制器或NVME控制器的,那么直接放心大胆的用就行了。如果你是服务器场景,SSD接到RAID控制器的,那么要费一番周折了,后面会讲。

1.SATA&NVME

最普遍的额场景是家用PC或笔记本电脑,这些设备一般都空间有限,存储的数据可能没服务器那么重要,基本都不太会使用RAID。

自从SSD出现之后,大量的厂家进入这个市场瓜分蛋糕,在这里其实不是每个厂家的SMART信息都是一样的。我手上用过三星、影驰、建兴、金士顿、铠侠等等品牌,接下来我就根据我用过的SSD来分别说明。

1.建兴

测试型号:LITEON CV8-8E128-11 SATA 128GB

sudo smartctl -a /dev/sda -S on输出
=== START OF INFORMATION SECTION ===
Device Model:     LITEON CV8-8E128-11 SATA 128GB
Serial Number:    *****************
LU WWN Device Id: 5 002303 101343e90
Firmware Version: C27110B
User Capacity:    128,035,676,160 bytes [128 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      M.2
TRIM Command:     Available, deterministic, zeroed
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-2 (minor revision not indicated)
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Mar  5 11:06:03 2024 CST
SMART support is: Available - device has SMART capability.SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE5 Reallocated_Sector_Ct   0x0003   100   100   000    Pre-fail  Always       -       09 Power_On_Hours          0x0002   100   100   000    Old_age   Always       -       302312 Power_Cycle_Count       0x0003   100   100   000    Pre-fail  Always       -       2296
175 Program_Fail_Count_Chip 0x0003   100   100   000    Pre-fail  Always       -       0
176 Erase_Fail_Count_Chip   0x0003   100   100   000    Pre-fail  Always       -       0
177 Wear_Leveling_Count     0x0003   100   100   000    Pre-fail  Always       -       213
178 Used_Rsvd_Blk_Cnt_Chip  0x0003   100   100   000    Pre-fail  Always       -       0
179 Used_Rsvd_Blk_Cnt_Tot   0x0003   100   100   000    Pre-fail  Always       -       0
180 Unused_Rsvd_Blk_Cnt_Tot 0x0003   100   100   005    Pre-fail  Always       -       93
181 Program_Fail_Cnt_Total  0x0003   100   100   000    Pre-fail  Always       -       0
182 Erase_Fail_Count_Total  0x0003   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0003   100   100   000    Pre-fail  Always       -       0
194 Temperature_Celsius     0x0002   100   100   000    Old_age   Always       -       29
195 Hardware_ECC_Recovered  0x0003   100   100   000    Pre-fail  Always       -       0
199 UDMA_CRC_Error_Count    0x0003   100   100   000    Pre-fail  Always       -       0
238 Unknown_Attribute       0x0003   090   090   000    Pre-fail  Always       -       90
241 Total_LBAs_Written      0x0003   100   100   000    Pre-fail  Always       -       18244761127
242 Total_LBAs_Read         0x0003   100   100   000    Pre-fail  Always       -       11662360995

我这款盘是建兴128G MLC的,使用的接口是M.2 2280,协议走的是SATA3。重点看这个参数:Wear_Leveling_Count这是全盘擦写次数的意思,一般MLC的擦写寿命在3000-10000之间,从数据上看我这个电脑用了好久了寿命还是100%,这是TLC不能比拟的。

2.金士顿

测试型号:KINGSTON SH103S3480G

sudo smartctl -a /dev/sda -S on输出
=== START OF INFORMATION SECTION ===
Model Family:     SandForce Driven SSDs
Device Model:     KINGSTON SH103S3480G
Serial Number:    *****************
LU WWN Device Id: 5 0026b7 23b01a009
Firmware Version: 521ABBF0
User Capacity:    480,103,981,056 bytes [480 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
TRIM Command:     Available
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS, ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Mar  5 10:43:17 2024 CST
SMART support is: Available - device has SMART capability.
SMART support is: EnabledSMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE1 Raw_Read_Error_Rate     0x0033   095   095   050    Pre-fail  Always       -       0/649489405 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       09 Power_On_Hours_and_Msec 0x0032   060   060   000    Old_age   Always       -       35599h+44m+40.970s12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1419
171 Program_Fail_Count      0x000a   000   000   000    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       125
177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       1
181 Program_Fail_Count      0x000a   000   000   000    Old_age   Always       -       0
182 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
187 Reported_Uncorrect      0x0012   100   100   000    Old_age   Always       -       0
189 Airflow_Temperature_Cel 0x0000   023   044   000    Old_age   Offline      -       23 (Min/Max 8/44)
194 Temperature_Celsius     0x0022   023   044   000    Old_age   Always       -       23 (Min/Max 8/44)
195 ECC_Uncorr_Error_Count  0x001c   120   120   000    Old_age   Offline      -       0/64948940
196 Reallocated_Event_Count 0x0033   100   100   003    Pre-fail  Always       -       0
201 Unc_Soft_Read_Err_Rate  0x001c   120   120   000    Old_age   Offline      -       0/64948940
204 Soft_ECC_Correct_Rate   0x001c   120   120   000    Old_age   Offline      -       0/64948940
230 Life_Curve_Status       0x0013   100   100   000    Pre-fail  Always       -       100
231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
233 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       20744
234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       16053
241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       16053
242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       13813

运气很好,这块还是MLC的还是480G的容量,官方给定的总写入数据量1785TBW,目前已经写入16053GB。这块SSD和建兴不一样,要看SSD_Life_Left这个字段,目前依然是100%寿命,说起来也用了好几年了,只能说MLC寿命依然是王者,只可惜以后消费市场基本是TLCQLC的天下了,想买MLC恐怕不容易了。

3.Intel SSD

测试产品:INTEL SSDSC2KB960G8

sudo smartctl -a /dev/sda -S on输出
=== START OF INFORMATION SECTION ===
Device Model:     INTEL SSDSC2KB960G8
Serial Number:    ******************
LU WWN Device Id: 5 5cd2e4 150a52b66
Firmware Version: XCV10120
User Capacity:    960,197,124,096 bytes [960 GB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 T13/2161-D revision 5
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Tue Mar  5 10:08:04 2024 CST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled=== START OF ENABLE/DISABLE COMMANDS SECTION ===
SMART Attribute Autosave Enabled.SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       09 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       3110812 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       27
170 Unknown_Attribute       0x0033   100   100   010    Pre-fail  Always       -       0
171 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
172 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
174 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       17
175 Program_Fail_Count_Chip 0x0033   100   100   010    Pre-fail  Always       -       120259021263
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   090    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   082   073   000    Old_age   Always       -       18 (Min/Max 13/28)
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       17
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       18
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       0
225 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       953953
226 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       542
227 Unknown_SSD_Attribute   0x0032   100   100   000    Old_age   Always       -       84
228 Power-off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       1866299
232 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   100   100   000    Old_age   Always       -       0
234 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
235 Unknown_Attribute       0x0033   100   100   010    Pre-fail  Always       -       120259021263
241 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       953953
242 Total_LBAs_Read         0x0032   100   100   000    Old_age   Always       -       5388177
243 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       1988132

这块是服务器级别的SSD,和普通的消费级略有差异,价格也不便宜。看了官方介绍是64-Layer TLC 3D Nand,以为是战五渣,没想到居然是王者,寿命达到了恐怖的3.5 PBW,平均故障时间200万小时。这块SSD要看Media_Wearout_Indicator这个参数,依然是100%寿命,可以放心使用了,等降到10%左右就可以考虑换硬盘了,很多服务器都是两块组RAID 1,基本稳了!

4.西数

测试产品:WD Blue SN570 500GB SSD
这个SSD我是用在Windows办公电脑上的,没装Linux,所以我在Windows上看了下,Linux上看到的Smart信息应该是一样的。这里要区分下因为M.2的SSD我见过的就两种协议,第一种就是NVME协议,第二种是SATA协议。如果走NVME协议,设备名就是/dev/nvme*(/dev/nvme0n1p1就是第一块NVME硬盘的第一个分区①),如果走的SATA协议,设备名就是/dev/sd*(/dev/sda1就是第一块SATA硬盘的第一个分区)。

注:M.2只是硬件接口规格,不是所有的M.2都是1000MB+的顺序速度,SATA也就600MB左右,以后买硬盘不要被别人忽悠了!

①:NVME协议的硬盘使用p1、p2、p3...来区分不同的分区。

sudo smartctl -a /dev/nvme0n1 -S on如果不行就试试下面的
sudo smartctl -a -d nvme /dev/nvme0n1 -S on输出
=== START OF INFORMATION SECTION ===
Model Number:                       WD Blue SN570 500GB SSD
Serial Number:                      **********
Firmware Version:                   234110WD
PCI Vendor/Subsystem ID:            0x15b7
IEEE OUI Identifier:                0x001b44
Total NVM Capacity:                 500,107,862,016 [500 GB]
Unallocated NVM Capacity:           0
Controller ID:                      0
NVMe Version:                       1.4
Number of Namespaces:               1
Namespace 1 Size/Capacity:          500,107,862,016 [500 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            ***** **********
Local Time is:                      Tue Mar  5 13:52:35 2024 CST
Firmware Updates (0x14):            2 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x005f):     Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Timestmp
Log Page Attributes (0x1e):         Cmd_Eff_Lg Ext_Get_Lg Telmtry_Lg Pers_Ev_Lg
Maximum Data Transfer Size:         128 Pages
Warning  Comp. Temp. Threshold:     80 Celsius
Critical Comp. Temp. Threshold:     85 Celsius
Namespace 1 Features (0x02):        NA_FieldsSupported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat0 +     3.70W    3.10W       -    0  0  0  0        0       01 +     2.70W    2.10W       -    0  0  0  0        0       02 +     1.90W    1.80W       -    0  0  0  0        0       03 -   0.0250W       -        -    3  3  3  3     3900   110004 -   0.0050W       -        -    4  4  4  4     5000   44000Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf0 +     512       0         21 -    4096       0         1=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSEDSMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        36 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    1,170,348 [599 GB]
Data Units Written:                 1,521,702 [779 GB]
Host Read Commands:                 11,926,746
Host Write Commands:                16,193,571
Controller Busy Time:               41
Power Cycles:                       168
Power On Hours:                     884
Unsafe Shutdowns:                   90
Media and Data Integrity Errors:    0
Error Information Log Entries:      1
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0Error Information (NVMe Log 0x01, 16 of 256 entries)

这块是货真价实的M.2插槽,NVME协议SSD,只不过材质是TLC的,号称3500MB的顺序读取和2500MB的顺序写入,官方号称平均无故障时间150万小时,只可惜写入寿命只有可怜的300TBW,TLC差不多都这个尿性,毕竟一分钱一分货,综合还是比刚出来的那会好很多了。

5.铠侠

测试设备:KBG40ZNS512G NVMe KIOXIA 512GB 512.1 GB
由于装在Windows上,所以我直接取Windows上的数据了,smartctl查看方式和WD BLue一样的。

/dev/nvme0n1就是你的SSD,不同的机器可能名字不一样
sudo smartctl -a /dev/nvme0n1 -S on

在这里插入图片描述
这块也是货真价实的NVME的SSD,颗粒是112-layer BiCS FLASH™ 3D TLC的,最大写入量也是300TBW。主要看Percentage used这一项,显示寿命使用了8%,还剩92%,这比较符合TLC的寿命表现,作为系统盘+游戏盘,这个表现能说的过去。

6.三星

测试设备:SAMSUNG MZ7LM480HCHP-00003 480.1 GB
由于装在Windows上,所以我直接取Windows上的数据了。

SATA协议
sudo smartctl -a /dev/sda -S on

在这里插入图片描述
SMART参数和前面的Intel很像,主要看Wear_Leveing_Count这一项,显示使用了1%,还剩99%的寿命。这个是三星的数据中心系列产品,写入寿命为0.8DWPD,和我们之前看到的表示方法不一样,这个是Drive Writes Per Day,就是每天写满磁盘次数,这个地方是0.8就是说每天能写满384GB,然后这个状态可以持续3年(?),实际的写入量就是3365384GB。

7.影驰

测试产品:GALAX GX0240L9A080-C1 240.0 GB
这个产品有点年头了,是我买的第一款影驰的SSD,当时就是图便宜,还是MLC。同样是装Windows系统的,没有装Linux。

sudo smartctl -a /dev/sda -S on

在这里插入图片描述
感觉应该是哪里有些问题,256G还是MLC仅仅做系统盘的话不应该损耗这么大,也可能是检测软件的问题。现在估计也没人用这么旧的SSD了,随便看看就好。

2.RAID

前面说的都是直接接在SATA控制器或NVME控制器上的SSD,还有一种隐藏在RAID后面的这种方法就不行了。针对不同的RAID控制器,smartctl有不同的方法去获取SSD健康信息。我们的服务器主要是基于MegaRAID的,其它的RAID用的不多,不过我会给出来命令,你可以自行尝试,等我用过这些产品再补充。

1.MegaRAID

需要下载专用的工具megacli,这种方式直接在系统里看就行了,不需要跳转BIOS,也不会对设备运行产生任何影响。下面的操作基于你已经有megacli了,如果没有请看下面的安装方法。
MegaCLI安装方法

获取Device ID
sudo megacli -PDList -aALL输出
Enclosure Device ID: 252
Slot Number: 0
Drive's position: DiskGroup: 0, Span: 0, Arm: 0
Enclosure position: N/A
Device Id: 5
WWN: 55cd2e4150a52b66
Sequence Number: 2
Media Error Count: 0
Other Error Count: 0
Predictive Failure Count: 0
Last Predictive Failure Event Seq Number: 0
PD Type: SATA

找到你想看的设备的Device id,上面的是5,一会要用到。

sudo smartctl -a -d megaraid,5 /dev/sdd -S on

输出和SATA&NVME的设备一样,这里不细说了。

megaraid,5:megaraid后面的5就是刚才的Device id,每个硬盘都有一个独一无二的Device id,哪怕是分到同一个RAID下的硬盘Device id也是不一样的。

2.PERC

Dell PERC (PowerEdge RAID Controller), computer hardware used in Dell PowerEdge servers。
这个和MegaRAID一样需要安装一个工具perccli,我手上的RAID控制器是PERC H330 Mini,属于Dell PERC 9系列产品。隐藏在这个RAID控制器下的硬盘通过megaraid的方法也可以获取到Smart信息,但是megacli不能用来管理PERC的设备,这个回头会说。

perccli的安装方式回头我会补上,我的服务器系统是Ubuntu-18.04,有需要的可以先在我的资源里下载,后续我会教你们自己安装移植。
perccli.tar

安装方法
tar -xmf perccli.tar
sudo mkdir /opt/MegaRAID
sudo mv perccli /opt/MegaRAID
sudo ln -s /opt/MegaRAID/perccli/perccli64 /usr/sbin/perccli64

接着我们只要使用perccli64拿到DID就可以查询Smart信息了。

sudo perccli64 /c0 show all输出
Physical Drives = 8PD LIST :
=======---------------------------------------------------------------------------
EID:Slt DID State DG      Size Intf Med SED PI SeSz Model               Sp
---------------------------------------------------------------------------
32:0      0 Onln   0 893.75 GB SATA SSD N   N  512B INTEL SSDSC2KB960G8 U
32:1      1 Onln   0 893.75 GB SATA SSD N   N  512B INTEL SSDSC2KB960G8 U
32:2      2 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:3      3 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:4      4 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:5      5 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:6      6 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
32:7      7 Onln   1  7.276 TB SAS  HDD N   N  512B ST8000NM0185        U
---------------------------------------------------------------------------

看DID那一栏,那就是我们要找的设备ID,类似于MegaRAID的Device id。我的服务器有8块硬盘,两块SSD组成了RAID 1,另外6块组成了RAID 1+0,这个后面会说,想看哪个SSD就用哪个DID就行了。

sudo smartctl -a -d megaraid,0 /dev/sdd -S on

megaraid,0:就是第一块SSD,这台机器上所有的硬盘都是隐藏在RAID后面的SSD,都可以用这种方法看。

补充:之前留下了问题,为什么megacli不能配置PERC 9的设备。请看下面:

在PERC 9的设备上看RAID级别
sudo megasasctl输出
a0       PERC H330 Mini           encl:1 ldrv:2  batt:FAULT, module missing, pack missing, charge failed
a0d0       893GiB RAID 1   1x2  optimal
a0d1           0B RAID 17   1x6  optimal
a0e32s0     894GiB  a0d0  online
a0e32s1     894GiB  a0d0  online
a0e32s2    7452GiB  a0d1  online
a0e32s3    7452GiB  a0d1  online
a0e32s4    7452GiB  a0d1  online
a0e32s5    7452GiB  a0d1  online
a0e32s6    7452GiB  a0d1  online
a0e32s7    7452GiB  a0d1  online

看到问题没有直接蹦出个RAID 17,我是没听说过还有这种RAID,也许是我孤陋寡闻,我查了各种资料也没找到答案,stackoverflow上一个老外也在问这个问题,搞不好他是和我一样的情形。直到我找到perccli这个工具。一个属于PERC 9自己的工具,我才恍然大悟!。

使用perccli64查看
sudo perccli64 /c0 show all输出
Virtual Drives = 2VD LIST :
=======---------------------------------------------------------------
DG/VD TYPE   State Access Consist Cache Cac sCC      Size Name
---------------------------------------------------------------
0/0   RAID1  Optl  RW     Yes     NRWTD -   OFF 893.75 GB
1/1   RAID10 Optl  RW     Yes     NRWTD -   OFF 21.830 TB
---------------------------------------------------------------

RAID10才是庐山真面目,还是工具用的不对。不过,这不能怪开发者,因为RAID Controller型号实在是太多了,光Dell一家也得有几十种吧,更不用说还有浪潮、华为、Supermicro等一票大厂。

这里多说一句,每块磁盘8TB(实际可用7.3TB左右),每两块磁盘先组成RAID 1,然后3组RAID 1组成RAID 0。就是说哪怕这三组RAID 1同时各坏了一块硬盘数据完整性也能保证,只需要定位故障硬盘,热插拔更换故障硬盘就行了,RAID会自动重建数据的。.

3.浪潮PM8204-2G

我手上的这个控制器市在Windows系统上,暂时先预留着,后面遇到了再说。

4.AacRaid

这个我手上也没有现成的,方法在下面:

sudo smartctl -a -d aacraid,0,0,2 /dev/sda

aacraid,0,0,2:0,0,2对应着(Host number, Lun, ID),你可以通过相关工具获取上面三个值。

5.3ware RAID

这个我手上也没有现成的,方法在下面:

sudo smartctl -a -d 3ware,2 /dev/sda

3ware,2:2对应应该也是设备ID,范围是0-127

6.Areca SATA RAID

这个我手上也没有现成的,参考方法在下面:

sudo smartctl -a -d areca,2 /dev/sg2

areca,2:也是和设备ID相关的,范围是1-24

7.cciss RAID

这个我手上也没有现成的,参考方法在下面:

sudo smartctl -a -d cciss,0 /dev/cciss/c0d0

cciss,0:0类似于设备ID,范围从0-15

注:除MegaRAID和PERC 9以外,其它RAID未经过测试,感兴趣的可以尝试下!


总结

1、SATA和NVME的主要区别是设备名字不一样
2、隐藏再RAID后面的设备不能直接看,需要借助RAID CLI
3、不要等到寿命快消耗完了才想到更换,应该早做打算。一般剩10%就应该特别注意了。
4、还有一点需要注意,这种方法不是万能的,有时候可能整体是健康的突然坏了,比如之前的固件门

这篇关于使用smartmontools查看SSD的寿命的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/778469

相关文章

Python使用FastAPI实现大文件分片上传与断点续传功能

《Python使用FastAPI实现大文件分片上传与断点续传功能》大文件直传常遇到超时、网络抖动失败、失败后只能重传的问题,分片上传+断点续传可以把大文件拆成若干小块逐个上传,并在中断后从已完成分片继... 目录一、接口设计二、服务端实现(FastAPI)2.1 运行环境2.2 目录结构建议2.3 serv

Spring Security简介、使用与最佳实践

《SpringSecurity简介、使用与最佳实践》SpringSecurity是一个能够为基于Spring的企业应用系统提供声明式的安全访问控制解决方案的安全框架,本文给大家介绍SpringSec... 目录一、如何理解 Spring Security?—— 核心思想二、如何在 Java 项目中使用?——

springboot中使用okhttp3的小结

《springboot中使用okhttp3的小结》OkHttp3是一个JavaHTTP客户端,可以处理各种请求类型,比如GET、POST、PUT等,并且支持高效的HTTP连接池、请求和响应缓存、以及异... 在 Spring Boot 项目中使用 OkHttp3 进行 HTTP 请求是一个高效且流行的方式。

Java使用Javassist动态生成HelloWorld类

《Java使用Javassist动态生成HelloWorld类》Javassist是一个非常强大的字节码操作和定义库,它允许开发者在运行时创建新的类或者修改现有的类,本文将简单介绍如何使用Javass... 目录1. Javassist简介2. 环境准备3. 动态生成HelloWorld类3.1 创建CtC

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

C#使用Spire.Doc for .NET实现HTML转Word的高效方案

《C#使用Spire.Docfor.NET实现HTML转Word的高效方案》在Web开发中,HTML内容的生成与处理是高频需求,然而,当用户需要将HTML页面或动态生成的HTML字符串转换为Wor... 目录引言一、html转Word的典型场景与挑战二、用 Spire.Doc 实现 HTML 转 Word1

Java中的抽象类与abstract 关键字使用详解

《Java中的抽象类与abstract关键字使用详解》:本文主要介绍Java中的抽象类与abstract关键字使用详解,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、抽象类的概念二、使用 abstract2.1 修饰类 => 抽象类2.2 修饰方法 => 抽象方法,没有

MyBatis ParameterHandler的具体使用

《MyBatisParameterHandler的具体使用》本文主要介绍了MyBatisParameterHandler的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参... 目录一、概述二、源码1 关键属性2.setParameters3.TypeHandler1.TypeHa

Spring 中的切面与事务结合使用完整示例

《Spring中的切面与事务结合使用完整示例》本文给大家介绍Spring中的切面与事务结合使用完整示例,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录 一、前置知识:Spring AOP 与 事务的关系 事务本质上就是一个“切面”二、核心组件三、完