본문으로 건너뛰기

Software Raid 장애 발생 시 어떻게 처리하나요?

💡 요약 정리

  • Software RAID 장애 시 디바이스 강제 fail, 제거, 교체, 추가 순서로 처리합니다.
  • mdadm 및 /proc/mdstat 명령어를 통해 상태를 모니터링할 수 있습니다.
  • rebuild 과정이 완료되면 RAID는 정상 상태로 복원됩니다.
  • 다음 순서대로 명령어를 실행하세요.

1. 디바이스 강제 fail 처리

[root@localhost ~]# mdadm /dev/md0 -f /dev/sda5
mdadm: set /dev/sda5 faulty in /dev/md0

[root@localhost ~]# cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid5 sda7[2] sda6[1] sda5[3](F)
       594176 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]

unused devices: <none>

2. Fail이 발생한 디바이스 제거

[root@localhost ~]# mdadm /dev/md0 -r /dev/sda5
mdadm: hot removed /dev/sda5

[root@localhost ~]# cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid5 sda7[2] sda6[1]
       594176 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]

unused devices: <none>

3. 디바이스 교체 후 RAID 디바이스에 추가

[root@localhost data]# mdadm /dev/md0 -a /dev/sda5
mdadm: re-added /dev/sda5

4. Rebuild 상태 확인

[root@localhost data]# cat /proc/mdstat
mdadm: Cannot open /dev/sda5: Device or resource busy
Personalities : [raid6] [raid5] [raid4]
md0 : active raid5 sda5[0] sda7[2] sda6[1]
       594176 blocks level 5, 64k chunk, algorithm 2 [3/2] [_UU]
       [====>................]  recovery = 29.5% (88320/297088) finish=0.0min speed=44160K/sec

unused devices: <none>