|
ファン交換したLS-VLのHDDが危ない
"Offline_Uncorrectable"が 1 になってた
ファン交換したLS-VLだが、ふと気付いたら S.M.A.R.T.の"Offline_Uncorrectable"の値が 1 になっていた。
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 253 172 021 Pre-fail Always - 1750
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 733
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 082 082 000 Old_age Always - 13842
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 726
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 109
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 635
194 Temperature_Celsius 0x0022 112 100 000 Old_age Always - 38
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 6
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed: read failure 90% 13527 8361000
|
"Offline_Uncorrectable"ってのは何なのか?調べたところ「修復不可能なエラーが検出されたセクタ数」ということらしい。ワタシの LS-VL では定期的にS.M.A.R.T.のテストを行わせているのだが、そのテストスキャンで検出された結構重大なエラーであり、通常の不良セクタであれば代替セクタが割り当てられるところが、どうやらそれすら出来ていないようだ。実際 "Reallocated_Sector_Ct"、"Current_Pending_Sector" は何れも 0 だ。
物理的に重大な損傷が発生している可能性が高いので、代替のNASを用意してバックアップに取りかかった。これが大変で、容量3TBのHDDで90%くらい使っていることもあり、とにかく時間がかかる。毎日ファイルの吸い出しにかかりっきりで、何だかんだ2週間以上かかっただろうか。昨日で何とか全部吸い出すことはできたのだが、エラーセクタに記録されていたファイルは破損しているかもしれない。それがどのファイルかは分からないのだが・・・
バックアップをしている間にも時々S.M.A.R.T.を見ていたのだが、ある時 "Offline_Uncorrectable" が 0 に戻っている事に気が付いた。何で?修復不可能のはずが、勝手に修復されてしまったよ。こんな事ってあるんだろうか?
不良セクタはそこに書き込みを行わせると強制的に代替セクタに置き換えることができる場合があるそうだ。そのためLS-VLから HDD を取り出して、全域ゼロ書き込みをやってみた。ただ最近の macOS のディスクユーティリティには「完全消去(全域にゼロ書き込み)」機能が使えなくなったので、ターミナルから行う。
$ diskutil list
/dev/disk15 (external, physical):
#: TYPE NAME SIZE IDENTIFIER
0: GUID_partition_scheme *3.0 TB disk15
1: EFI NO NAME 209.7 MB disk15s1
2: Apple_HFS 名称未設定 3.0 TB disk15s2
$ diskutil secureErase 0 /dev/disk15
Started erase on disk15
$<3>[ - 0%..10%..20%..30%..40%..50%..60%..70%................ ] 79.3%
|
こちらも時間がかかっており、昨夜から始めて18時間以上が経つのだが、まだ終らない。さてさて、これで代替セクタが割り当てられるのか、それともエラーが消えて正常な状態に戻るのか?
追記:
全域ゼロ書き込みが完了。その後に採ったS.M.A.R.T.情報が以下。
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 234 172 021 Pre-fail Always - 3291
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 737
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 081 081 000 Old_age Always - 14144
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 730
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 113
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 635
194 Temperature_Celsius 0x0022 114 100 000 Old_age Always - 36
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
SMART Error Log Version: 1
No Errors Logged
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 14081 -
# 2 Extended offline Completed without error 00% 14070 -
|
"Offline_Uncorrectable"のエラーが消え、代替セクタも使われていない。セルフテストも問題なくパスした。完全に正常な状態に戻ったようだ。これなら、まだ使えそうかな?
|