Linux 硬盘检测健康状态 smartctl
2023-04-01 08:13:37
smartctl 是一个智能磁盘监控工具,可以用于读取和分析 S.M.A.R.T. 数据(Self-Monitoring, Analysis and Reporting Technology)。S.M.A.R.T. 是一种用于磁盘驱动器的自我诊断技术,它可以检测磁盘驱动器的健康状态并提供警告,以帮助预测可能的故障。S.M.A.R.T. 通过收集磁盘驱动器的运行数据并评估这些数据来确定驱动器是否正常运行。
安装
```
$ yum install smartmontools.x86_64 -y
```
查看硬盘信息
```
$ fdisk -l
磁盘 /dev/nvme0n1:1024.2 GB, 1024209543168 字节,2000409264 个扇区
Units = 扇区 of 1 * 512 = 512 bytes
扇区大小(逻辑/物理):512 字节 / 512 字节
I/O 大小(最小/最佳):512 字节 / 512 字节
磁盘标签类型:dos
磁盘标识符:0x000b0030
```
对 nvme0n1设备进行检测,输出健康状态信息和统计数据
```
smartctl /dev/nvme0n1 -a
```
```
smartctl 7.0 2018-12-30 r4883 [x86_64-linux-3.10.0-1160.88.1.el7.x86_64] (local build)
Copyright (C) 2002-18, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Model Number: ZHITAI TiPlus7100 1TB
Serial Number: ZTA41T0BA224646395
Firmware Version: ZTA22002
PCI Vendor/Subsystem ID: 0x1e49
IEEE OUI Identifier: 0x000000
Total NVM Capacity: 1,024,209,543,168 [1.02 TB]
Unallocated NVM Capacity: 0
Controller ID: 0
Number of Namespaces: 1
Namespace 1 Size/Capacity: 1,024,209,543,168 [1.02 TB]
Namespace 1 Formatted LBA Size: 512
Namespace 1 IEEE EUI-64: a428b7 0133ea00c2
Local Time is: Fri Mar 31 20:00:04 2023 EDT
Firmware Updates (0x16): 3 Slots, no Reset required
Optional Admin Commands (0x0017): Security Format Frmw_DL Self_Test
Optional NVM Commands (0x001f): Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
Maximum Data Transfer Size: 128 Pages
Warning Comp. Temp. Threshold: 90 Celsius
Critical Comp. Temp. Threshold: 95 Celsius
Supported Power States
St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat
0 + 6.50W - - 0 0 0 0 0 0
1 + 5.80W - - 1 1 1 1 0 0
2 + 3.60W - - 2 2 2 2 0 0
3 - 0.0500W - - 3 3 3 3 5000 10000
4 - 0.0025W - - 4 4 4 4 8000 45000
Supported LBA Sizes (NSID 0x1)
Id Fmt Data Metadt Rel_Perf
0 + 512 0 0
=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 48 Celsius
Available Spare: 100%
Available Spare Threshold: 1%
Percentage Used: 0%
Data Units Read: 5,734 [2.93 GB]
Data Units Written: 45,830 [23.4 GB]
Host Read Commands: 83,245
Host Write Commands: 1,058,830
Controller Busy Time: 2
Power Cycles: 9
Power On Hours: 15
Unsafe Shutdowns: 6
Media and Data Integrity Errors: 0
Error Information Log Entries: 0
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 48 Celsius
Temperature Sensor 2: 28 Celsius
Error Information (NVMe Log 0x01, max 64 entries)
No Errors Logged
```
```
Model Number:硬盘型号
Serial Number:硬盘序列号
Firmware Version:硬盘固件版本
Total NVM Capacity:硬盘总容量
Unallocated NVM Capacity:硬盘未分配的容量
Namespace 1 Size/Capacity:硬盘第一个 Namespace 的容量
Namespace 1 Formatted LBA Size:硬盘第一个 Namespace 的逻辑块大小
SMART overall-health self-assessment test result:硬盘健康状态自检结果
Temperature:硬盘当前温度
Available Spare:剩余可用的空间比例
Available Spare Threshold:空间不足警戒线比例
Percentage Used:已使用空间比例
Data Units Read:已读取数据块数
Data Units Written:已写入数据块数
Host Read Commands:主机读取命令次数
Host Write Commands:主机写入命令次数
Power Cycles:硬盘上电次数
Power On Hours:硬盘通电时长
Unsafe Shutdowns:硬盘因未正常关机而出现的故障次数
Media and Data Integrity Errors:硬盘数据读写时出现的错误次数
Error Information Log Entries:错误信息日志条目数
Temperature Sensor 1:硬盘温度传感器1的温度
Temperature Sensor 2:硬盘温度传感器2的温度
```
```
型号:ZHITAI TiPlus7100 1TB
序列号:ZTA41T0BA224646395
固件版本:ZTA22002
PCI 供应商/子系统 ID:0x1e49
IEEE OUI 标识符:0x000000
NVM 总容量:1,024,209,543,168 [1.02 TB]
未分配的 NVM 容量:0
控制器 ID:0
命名空间数:1
命名空间 1 大小/容量:1,024,209,543,168 [1.02 TB]
命名空间 1 格式化 LBA 大小:512
命名空间 1 IEEE EUI-64:a428b7 0133ea00c2
本地时间:Fri Mar 31 20:00:04 2023 EDT
固件更新 (0x16):3 个插槽,无需重置
可选管理员命令 (0x0017):安全性格式化 Frmw_DL 自检
可选 NVM 命令 (0x001f):Comp Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat
最大数据传输大小:128 个页面
警告 组件温度阈值:90 摄氏度
临界 组件温度阈值:95 摄氏度
```
```
=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
```
硬盘的健康状态,测试结果为“PASSED”,即硬盘健康状况良好。
```
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 48 Celsius
Available Spare: 100%
Available Spare Threshold: 1%
Percentage Used: 0%
Data Units Read: 5,734 [2.93 GB]
Data Units Written: 45,830 [23.4 GB]
Host Read Commands: 83,245
Host Write Commands: 1,058,830
Controller Busy Time: 2
Power Cycles: 9
Power On Hours: 15
Unsafe Shutdowns: 6
Media and Data Integrity Errors: 0
Error Information Log Entries: 0
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 48 Celsius
Temperature Sensor 2: 28 Celsius
```
```
严重警告:这个设备没有任何严重警告。
温度:设备当前温度为摄氏48度。
可用备用空间:设备可用备用空间为100%。
可用备用空间阈值:设备可用备用空间的最低阈值为1%。
使用百分比:设备目前使用百分比为0%。
数据单元读取:已读取的数据单元数为5,734个(2.93 GB)。
数据单元写入:已写入的数据单元数为45,830个(23.4 GB)。
主机读取命令数:已发送的主机读取命令数为83,245个。
主机写入命令数:已发送的主机写入命令数为1,058,830个。
控制器忙碌时间:设备的控制器累计忙碌时间为2。
电源循环次数:设备已经被重新上电的次数为9。
上电时间:设备已经连续工作的小时数为15。
不安全关机次数:设备在工作时遭遇的不安全关机的次数为6。
媒体和数据完整性错误:设备媒体和数据的完整性错误次数为0。
错误信息日志条目:设备记录的错误信息日志条目数为0。
警告温度时间:设备在警告温度(90摄氏度)以上的时间为0。
严重温度时间:设备在严重温度(95摄氏度)以上的时间为0。
温度传感器1:设备温度传感器1当前温度为摄氏48度。
温度传感器2:设备温度传感器2当前温度为摄氏28度。
```