Software Raid 장애 발생 시 어떻게 처리하나요?
💡 요약 정리
- Software RAID 장애 시 디바이스 강제 fail, 제거, 교체, 추가 순서로 처리합니다.
- mdadm 및 /proc/mdstat 명령어를 통해 상태를 모니터링할 수 있습니다.
- rebuild 과정이 완료되면 RAID는 정상 상태로 복원됩니다.
- 다음 순서대로 명령어를 실행하세요.
1. 디바이스 강제 fail 처리
[root@localhost ~]# mdadm /dev/md0 -f /dev/sda5
mdadm: set /dev/sda5 faulty in /dev/md0
[root@localhost ~]# cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid5 sda7[2] sda6[1] sda5[3](F)
594176 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]
unused devices: <none>
2. Fail이 발생한 디바이스 제거
[root@localhost ~]# mdadm /dev/md0 -r /dev/sda5
mdadm: hot removed /dev/sda5
[root@localhost ~]# cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid5 sda7[2] sda6[1]
594176 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]
unused devices: <none>
3. 디바이스 교체 후 RAID 디바이스에 추가
[root@localhost data]# mdadm /dev/md0 -a /dev/sda5
mdadm: re-added /dev/sda5
4. Rebuild 상태 확인
[root@localhost data]# cat /proc/mdstat
mdadm: Cannot open /dev/sda5: Device or resource busy
Personalities : [raid6] [raid5] [raid4]
md0 : active raid5 sda5[0] sda7[2] sda6[1]
594176 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]
[====>................] recovery = 29.5% (88320/297088) finish=0.0min speed=44160K/sec
unused devices: <none>