さらにトラブル発生。今度はメインファイルサーバーのRAID5を構成する、HDDの1台が壊れてしまいました😅。【注*1】
色々なもののメンテを怠っていた罰が、立て続けに、あたっている気がしてきます😅。
0.RAIDカード
小生が、メインファイルサーバーで使っているRAIDカードは、かなり古いですが"RockRaid 2720SGL(RR2720SGL)"を2枚刺して運用しています。
廃版品なので、市場価格はやたら高くなっていますが、現行品は、もっとコスパの良いものがあると思います。
後継機[*2]は、8チャンネル(SAS/SATA HDD 8台接続)になりますが、こちらみたいです。
1.予兆??
最近、時々、RAID5を構成するハードディスク(HDD)の1本だけが、アクセスランプが他のHDDより長く点灯することが、時々ありました。
ここ数日は、"shtdown -p now”しても、電源断にならないな、と思っていました。
samba経由で、パソコンからデータを転送したら、突然、ネットワークドライブが読み書き不可に。
サーバーのコンソールを確認したら、大量のエラーメッセージ連続して表示されています。
「ctrl」+「alt」+「del」で再起動を試みるも、再起動しません😵。
2.ディスクの交換
(1)ドライブの解列
使っているドライブケージは”キング・テック マルチベイSATA内蔵専用リムーバブルハードディスクユニット MB453SPF”。
現在は絶版品ですが、ホットスペアに対応してます。
引用元[*3]
まずは、ホットスペアなので、エラーの出ているドライブを、強制的に解列させるために、ケージから取り出し。
FreeBSDがパニックになって、落ちた🥶。
致し方ないので、リセットボタンで再起動。
再起動すると、”ディスクが正常にアンマウントされなかった”メッセージは出なかったので、一安心です。
ディスクの方は、起動直後からRR2720SGLは自動的にスペアドライブを使って、再構築を始めてくれました😀。
(2)交換用HDDの準備
交換用HDDの準備します。
元々、QNAPの領域を拡張するための4TBの"WB Blue"を準備していたので、まずは、QNAPからRAID1構成の内の1本、2TBの"WB Red Plus"を解列して取り外しました。
4TBの"WB Blue"をQNAPに装着して、再構築。
QNAPから取り出した2TBの"WB Red Plus"を活用して、メインファイルサーバーのディスクをスペアドライブに割り当てたいと思います。
まずは、2TBの"WB Red Plus"を"ターミネータ10plus データ完全抹消"で2TBの"WB Red Plus"のすべてのセクタを”x00”で埋めて(Level1消去)、初期化しました。
初期化した2TBの"WB Red Plus"を"Crystal Disk Info"でディスクの状態を確認します。
2019/2から連続で利用しているので、使用時間は約49,000時間。
S.M.A.R.T.値は問題なさそうなので、これを使うことにします。
(3)交換用HDDの装着
2TBの"WB Red Plus"をケージのマウンターに固定し、メインファイルサーバーに装着。
再起動し、RR2720SGLのBIOS画面でスペアディスクに設定しました。
3.古いHDDのS.M.A.R.T.値を確認
HDDに刻印されている、SeagateのDateCodeは、”10353”なので、製造年月日は”2010/02/27”。
大分前に、テプラで使用開始年月をドライブに張り付けるようにしていたものの、このドライブだけ、”???????”と記録していました😅。
つまり、いつから使い始めたのか判らなくなっていたHDDです😅。
14年も前のディスク。今までよく持ったというところでしょうか。
故障したHDDは、使用時間は約20,000時間。思ったより、使用時間はあまり長くありません。
S.M.A.R.T.値は"05"が異常マーク。
赤マークがついているのは初めて見ました。
”C5”、”C6”は警告マーク。
JBODであれば、”C5”、”C6”は警告マークがついた段階で、何かしらの不具合が出るのですが。。
アクセスランプが他のHDDより長く点灯していたのが、その不具合だったのかもしれません。
この状態になるまで、良く使えていたと、ある意味、感動します😅。
RAID5のおかげで、この子の異常を他のディスクが何とかカバーしていたという事かもしれません。
最後の最後に、他のディスクもお手上げになってPanicしたという事かもしれません
この子には、長い間、お疲れさまでしたと、感謝しつつ、リサイクル業者に送り出します😅。