やはり300時間かかるのはおかしい(というか、待ちきれない)
ということでsshをonにして調べてみました。
cat /proc/mdstat
してみるとこんな感じの画面が出ます
1 2 3 4 5 6 7 8 |
Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] md127 : active raid6 sdf3[5] sde3[4] sdd3[3] sdc3[2](F) sdb3[1] sda3[0] 7794658816 blocks super 1.2 level 6, 64k chunk, algorithm 2 [6/5] [UU_UUU] [=========;...........] resync = 45.5% (887314168/1948664704) finish=1568.6min speed=11276K/secmd1 : active raid6 sda2[0] sdf2[5] sde2[4] sdd2[3] sdc2[2](F) sdb2[1] 2095872 blocks super 1.2 level 6, 64k chunk, algorithm 2 [6/5] [UU_UUU]md0 : active raid1 sda1[0] sdf1[5] sde1[4] sdd1[3] sdc1[2](F) sdb1[1] 4192192 blocks super 1.2 [6/5] [UU_UUU] unused devices: <none> |
これは対処した後なのでsdc*にF(Fails)マークがついていますがこの時はまだついておらず、
残り時間が300時間ほどでした。
hdparm -t /dev/sdc
などでアクセス速度を調べてみると、sda,sdb,sdd-fは120-130M(Bytes/sec)程度の速度が出るのですが
sdcだけは1MBytes/secも出ていません。
決定的なのはsmartのshort testの結果が返ってきません・・・
やっぱり壊れてたOrz
物理的に引っこ抜けば一番なのですが、このReadyNas、遠隔地にあるため触れません。
そこでmdadmから無効化してみましょう。
まずdfでどのパーティションがどのRAIDドライブを使っているのかを確認します。
1 2 3 4 5 6 7 8 9 10 11 12 13 |
df Filesystem 1K-blocks Used Available Use% Mounted on rootfs 4192192 980496 2554408 28% / tmpfs 10240 4 10236 1% /dev /dev/md0 4192192 980496 2554408 28% / tmpfs 1019596 0 1019596 0% /dev/shm tmpfs 1019596 6008 1013588 1% /run tmpfs 1019596 0 1019596 0% /sys/fs/cgroup tmpfs 1019596 0 1019596 0% /media /dev/md127 7794658816 618694208 7173491384 8% /c /dev/md127 7794658816 618694208 7173491384 8% /home /dev/md127 7794658816 618694208 7173491384 8% /apps /dev/md127 7794658816 618694208 7173491384 8% /var/ftp/backups |
md127が最大容量のディスクとして使われていますね。
1 2 3 4 5 6 7 8 |
cat /proc/mdstat <div>Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] <span style="color: #ff0000;">md127</span> : active raid6 sdf3[5] sde3[4] sdd3[3] <span style="color: #ff0000;">sdc3</span>[2](F) sdb3[1] sda3[0] 7794658816 blocks super 1.2 level 6, 64k chunk, algorithm 2 [6/5] [UU_UUU] [=========>...........] resync = 45.5% (887314168/1948664704) finish=1568.6min speed=11276K/sec<span style="color: #ff0000;">md1</span> : active raid6 sda2[0] sdf2[5] sde2[4] sdd2[3] <span style="color: #ff0000;">sdc2</span>[2](F) sdb2[1] 2095872 blocks super 1.2 level 6, 64k chunk, algorithm 2 [6/5] [UU_UUU]<span style="color: #ff0000;">md0</span> : active raid1 sda1[0] sdf1[5] sde1[4] sdd1[3] <span style="color: #ff0000;">sdc1</span>[2](F) sdb1[1] 4192192 blocks super 1.2 [6/5] [UU_UUU]</div> unused devices: <none> |
md127にsdc3、md1にsdc2、md0にsdc1が使われていました。
そこでmdadmコマンドで故障扱いにします。
1 2 3 4 5 6 |
# mdadm --manage /dev/md0 --fail /dev/sdc1 mdadm: set /dev/sdc1 faulty in /dev/md0 # mdadm --manage /dev/md1 --fail /dev/sdc2 mdadm: set /dev/sdc2 faulty in /dev/md1 # mdadm --manage /dev/md127 --fail /dev/sdc3 mdadm: set /dev/sdc3 faulty in /dev/md127 |
これでRAIDからsdcが取り除かれました。
1 2 3 4 5 6 7 8 |
cat /proc/mdstat Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] md127 : active raid6 sdf3[5] sde3[4] sdd3[3] sdc3[2](F) sdb3[1] sda3[0] 7794658816 blocks super 1.2 level 6, 64k chunk, algorithm 2 [6/5] [UU_UUU] [=========>...........] resync = 45.5% (887314168/1948664704) finish=1568.6min speed=11276K/secmd1 : active raid6 sda2[0] sdf2[5] sde2[4] sdd2[3] sdc2[2](F) sdb2[1] 2095872 blocks super 1.2 level 6, 64k chunk, algorithm 2 [6/5] [UU_UUU]md0 : active raid1 sda1[0] sdf1[5] sde1[4] sdd1[3] sdc1[2](F) sdb1[1] 4192192 blocks super 1.2 [6/5] [UU_UUU] unused devices: <none> |
先ほどから出している画面です。
sdc*にF(Fails)マークがついているのがわかりますね。
この結果、初期化時間は30時間ほどまで短縮されました!