ReadyNAS RN10200が不調に(2)
どうしても止まらないスクラブ
スクラブさせたせいか、性能低下病の疑いのある2TB HDDを入れたせいか、はたまたeSATAポートに裸族の集合住宅を繋げたせいか?ともかく頻繁にシステムダウン、ハングする等の不調に見舞われるようになってしまったReadyNAS RN10200ですが、強制再起動の後のボリュームの再構築が終わっても、まだスクラブ中と表示されていました。
スクラブ進行状態のパーセンテージが少し上がったのは、RN10200の中のファイルをいくつか削除したためで、スクラブが進んだわけではありません。それが証拠に、更にファイルを削除していくと
といった具合に100%を越えてしまってもスクラブ中の表示のままです。実際にスクラブしているのかも怪しく、RN10200にrootでsshログインして btrfsコマンドを叩いても、
# btrfs scrub status /data
scrub status for 72d2684f-3743-40d6-83cf-55324578cd50
scrub started at Sat May 31 20:39:46 2014, running for 4861 seconds
total bytes scrubbed: 444.65GiB with 0 errors
# btrfs scrub cancel /data
ERROR: scrub cancel failed on /data: not running
# btrfs scrub resume /data
ERROR: scrub is already running.
To cancel use 'btrfs scrub cancel /data'.
To see the status use 'btrfs scrub status [-d] /data'.
# btrfs scrub start /data
ERROR: scrub is already running.
To cancel use 'btrfs scrub cancel /data'.
To see the status use 'btrfs scrub status [-d] /data'.
|
こんな具合。statusは 444.65GiBがスクラブ済みでエラーは0。スクラブをcancelしようとするとスクラブは動いていないと言います。でもスクラブを再開(resume)または開始(start)させようとすると、既にスクラブが動いていると言うのです。もう、何が何でもスクラブ中のままにしておきたいみたい。
この「14007010000」エラー状態が発生してスクラブが停止した場合、HDD故障の疑いが高いのでS.M.A.R.T.情報を確認すべきとのことです。確かに速度低下病の疑いがあるHDDを入れていますが、S.M.A.R.T.情報には何も異常なデータは出ていませんでした。セルフテストの結果も問題なしです。
# smartctl --all /dev/sda
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 253 169 021 Pre-fail Always - 975
4 Start_Stop_Count 0x0032 086 086 000 Old_age Always - 14447
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0
9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 7545
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 096 096 000 Old_age Always - 4912
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 364
193 Load_Cycle_Count 0x0032 166 166 000 Old_age Always - 103405
194 Temperature_Celsius 0x0022 109 102 000 Old_age Always - 41
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 7437 -
# smartctl --all /dev/sdb
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 194 163 021 Pre-fail Always - 5283
4 Start_Stop_Count 0x0032 092 092 000 Old_age Always - 8850
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 0
9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 10250
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 096 096 000 Old_age Always - 4285
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 247
193 Load_Cycle_Count 0x0032 171 171 000 Old_age Always - 88688
194 Temperature_Celsius 0x0022 109 101 000 Old_age Always - 41
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed without error 00% 10142 -
|
こうなったら、もう再フォーマットか、工場出荷状態へのリセットしかないか?と思い、バックアップを取りだしました。バックアップ先を試しに裸族の集合住宅に構築されたボリューム(/eda1)にしてみたところ、これがマズかったのか、途中で再びRN10200がハング、FrontViewが無応答状態になってしまいました。
と言うわけで、バックアップ先をMac Proにして、今やっとバックアップが終わったところ。これから再フォーマットか工場出荷状態へのリセットをやってみます。
|