- 2008-05-17 (土) 3:40
CentOS、Software RAID1構成のサーバで、RAID1にエラーが発生しました。
どうやらRAID1を構成するHDDの片方にI/Oエラーが起こり、片肺運転になっている様子。実は数週間前からこの状態を認識していたのですが、放置していました。片方が死んでも動き続けるとは、さすがRAID1。
RAID1の状態。md2が片肺運転になっている。
# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sdc2[1] sda2[0]
1052160 blocks [2/2] [UU]
md2 : active raid1 sda3[0]
311411904 blocks [2/1] [U_]
md0 : active raid1 sdc1[1] sda1[0]
104320 blocks [2/2] [UU]
本来ならディスクを交換するべきなのかもしれないですが、取りあえず現在のディスクを修復し、RAID構成を修復してみることに。
まずはRAIDから外されたパーティションを、e2fsckコマンドで修復。
# e2fsck -p /dev/sdb3 /dev/sdb3: recovering journal /dev/sdb3: Clearing orphaned inode 6980829 (uid=0, gid=0, mode=0100600, size=5148672) /dev/sdb3: Clearing orphaned inode 27591318 (uid=0, gid=0, mode=0100755, size=7556) /dev/sdb3: Clearing orphaned inode 27590930 (uid=0, gid=0, mode=0100755, size=8576) ...... /dev/sdb3: clean, 56793/38928384 files, 20381080/77852976 blocks
パーティションが修復された模様。
続いてRAID構成の修復。先ほど修復したパーティションを、mdadmコマンドでmd2デバイスへ追加し、元の状態へ戻す。
# mdadm -a /dev/md2 /dev/sdb3 mdadm: hot added /dev/sdb3
問題無く追加された。
状態の確認。
# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sdb2[1] sda2[0]
1052160 blocks [2/2] [UU]
md2 : active raid1 sdb3[2] sda3[0]
311411904 blocks [2/1] [U_]
[>....................] recovery = 0.2% (813440/311411904) finish=69.9min speed=73949K/sec
md0 : active raid1 sdc1[1] sda1[0]
104320 blocks [2/2] [UU]
RAID1の修復中。320GBのディスクの修復に70分ほどかかるらしい。
修復完了後のRAIDの状態。
# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sdc2[1] sda2[0]
1052160 blocks [2/2] [UU]
md2 : active raid1 sdc3[1] sda3[0]
311411904 blocks [2/2] [UU]
md0 : active raid1 sdc1[1] sda1[0]
104320 blocks [2/2] [UU]
無事RAID1が修復されました。これでしばらく様子を見て、エラーが再発するようならHDDを交換しようと思います。
参考
- Newer: iscsiを試す
- Older: Feedburner MyBrand 導入
Comments:0
Trackbacks:0
- Trackback URL for this entry
- http://juyama.net/2008/05/17/86/trackback
- Listed below are links to weblogs that reference
- RAID1の修復 from juyama.net

