QNAPでRAID6のリビルドが始まらない
QNAP(Ts-419P II)で3TB のHDD4本で組んでいるRAID6のリビルドが始まらない話。
壊れたのはドライブ3。
FW:4.2.0
電源を落としてHDDを交換すると駄目みたいで、同じような症状の方もちらほら。
症状としては、RAID6ボリュームが3TBのHDD3本で構成されていて、
これは縮退中(デグレ中)なんだけど、ストレージマネージャでは縮退中になっていない。
ダッシュボードの「システムの健康状態」にはデグレの警告が出ているけど、ストレージマネージャでは容量の拡大、ディスクの追加、ビットマップの中止、容量拡大くらいが使える状態で「復旧」はグレイアウト。
参考にしたサイト
[UU_U]になってるmd0がたぶん該当のドライブ。
[/dev] # cat /proc/mdstat
Personalities : [raid1] [linear] [raid0] [raid10] [raid6] [raid5] [raid4]
md0 : active raid6 sda3[0] sdb3[3] sdd3[1]
5857395200 blocks level 6, 64k chunk, algorithm 2 [4/3] [UU_U]
bitmap: 75/175 pages [300KB], 8192KB chunkmd4 : active raid1 sdd2[4](S) sdc2[3](S) sdb2[2] sda2[0]
530128 blocks super 1.0 [2/2] [UU]
md13 : active raid1 sdc4[0] sda4[3] sdd4[2] sdb4[1]
458880 blocks [4/4] [UUUU]
bitmap: 1/57 pages [4KB], 4KB chunkmd9 : active raid1 sda1[0] sdd1[3] sdc1[2] sdb1[1]
530048 blocks [4/4] [UUUU]
bitmap: 1/65 pages [4KB], 4KB chunkunused devices:
md0 : active raid6 sda3[0] sdb3[3] sdd3[1]
今回壊れたsdcの記載がないので追加してみる。
参考:http://dynamic-one.com/archives/51519346.html
[/dev] # mdadm /dev/md0 -a /dev/sdc3
mdadm: added /dev/sdc3
[/dev] #
これで、
[/dev] # mdadm /dev/md0 -a /dev/sdc3
mdadm: added /dev/sdc3
[/dev] # cat /proc/mdstat
Personalities : [raid1] [linear] [raid0] [raid10] [raid6] [raid5] [raid4]
md0 : active raid6 sdc3[4] sda3[0] sdb3[3] sdd3[1]
5857395200 blocks level 6, 64k chunk, algorithm 2 [4/3] [UU_U]
[>....................] recovery = 0.0% (150848/2928697600) finish=3882.3min speed=12570K/sec
bitmap: 75/175 pages [300KB], 8192KB chunkmd4 : active raid1 sdd2[4](S) sdc2[3](S) sdb2[2] sda2[0]
530128 blocks super 1.0 [2/2] [UU]
md13 : active raid1 sdc4[0] sda4[3] sdd4[2] sdb4[1]
458880 blocks [4/4] [UUUU]
bitmap: 1/57 pages [4KB], 4KB chunkmd9 : active raid1 sda1[0] sdd1[3] sdc1[2] sdb1[1]
530048 blocks [4/4] [UUUU]
bitmap: 1/65 pages [4KB], 4KB chunkunused devices:
[/dev] #
とりあえずリビルド始まった。
まだ再起動はしてない。
そして追加前にdiskでパーティション確認してない。。。
3Tのディスク4本のRAID6。現在25時間で70%弱。
(追記)
リビルド完了してて、コマンドラインでは
md0 : active raid6 sdc3[4] sda3[0] sdb3[3] sdd3[1] [UUUU]になっている。
でも表示が
- ドライブ3:マウント解除
- RAIDボリューム [123] になっている。
※そもそも縮退状態で[124] なんだけどダッシュボードも[123]になっている
ので表示と合っていない。
やっぱり一回工場出荷時に戻さないとダメかなぁ・・・
(2016/3/4追記)
メモ: /etc/storage.conf ファイルにストレージの状況が書かれていて、UIの表示はコレを参考にしているようだ。多分このファイルをいじれば表示が正しくなるんだけど、、、ちょっと悩み中。
そういうところを手で直したNASを使い続けて良いんだろうか。