raid 오류인데 어떤 하드 오류인지 확인하는 방법이 있을까요?

naan   
   조회 2778   추천 0    

안녕하세요.

raid 오류인데 어떤 하드 오류인지 확인하는 방법이 있을까요?

ontroller ID:  0   Puncturing bad block:   PD   Port 0 - 3:1:8      Location   0x11611e4e

오류는 위와 같습니다. media error 인거 같은데 하드 모두 확인해봐도 error count 가 모두 0 이여서 확인이 안되네요

혹시 location 0x11611e43 이거나 PD port 0 - 3:1:8 이걸로 몇번째 하드가 문제 인지 확인이 가능할까요?


미리 답변 감사합니다.






추가로 하드 상태는 이상 없습니다. 로그상에 에러 출력입니다.

짧은글 일수록 신중하게.
crow 2023-08
베드 직전 미디엄 에러 입니다 베드섹터 발생 레이드 문제커질 예정으로 판단됨
     
naan 2023-08
네 그래서 미리 교체를 하려 하는데 로그만 올라와 있고 하드 상태는 모두 정상으로 떠 있습니다.
crow 2023-08
데이터 백업 하시길 백업중 떨어질 확률 높음
백업 후 문제하드 교체 레이드 리빌딩 후 다시 레이드 제구성 후 데이터 복원하시길
보다 데이터 클린 크리티컬 운영하실거면 레이드 재 구성하시길
     
naan 2023-08
재구성하기엔 백업해야 할 데이터가 큽니다. 그냥 하나씩 교체 밖에 닶이 없을듯 하네요.
dateno1 2023-08
관리 소프트에서 포트 정보를 확인해서 거기 꽃혀있는 디스크의 시리얼같은 정보를 확인해보세요

이외에 트레이에 LED가 붙어있는 경우 그걸 이용해서 확인 가능한 경우도 있습니다
     
naan 2023-08
매치되는 하드가 있으면 확인하려 했는데 레이드 상태는 이상 있는 하드가 없습니다.
하드랙에 LED 도 이상이 없습니다. 로그상에 에러만 있습니다.
          
dateno1 2023-08
LED로 일단 위치는 확인해보세요

참고로 디스크가 오락가락하는걸 수 도 있지만, 베이같은게 문제 일 수 도 있습니다
               
naan 2023-08
넵 정보 감사합니다.
박문형 2023-08
레이드 레벨 얼마에 그 레이드 레벨로 묶인 총 하드디스크 갯수는 몇개인가요??
     
naan 2023-08
24bay 레이드6입니다.
레인보우7 2023-08
RAID 스케줄러에서 Check Consistency 돌리다가 RAID 구성 데이터 일관성 오류가 발견되어서  Bad block이 있는 디스크를 Puncturing 작업을 선조치 한거네요. 
일단 긴급조치작업은 한것 같구요. Puncturing 작업은 불량 섹터가 발견되면 해당 섹터는 더 이상 사용되지(페리티 연산에서 제외) 않도록 표시하거나 빵구를 내네요.

당장은 레이드 볼륨에 영향을 주지는 않겠지만, 일단 디스크 bad sector가 많이 생길 가능성이 있는 디스크들(2개)로 보여서
맛갈 준비가 되어가는것 같아서 교체를 준비하시는게 안전할듯 합니다.  제일 위험한게 리빌드 하다가 두개 뻣으면 문제라서
주요 데이터는  백업을 진행한후에 리빌드 작업하시는게 안전할것 같습니다.
     
naan 2023-08
아 맞습니다. 특정시간에 오류가 쭉 올라온거 보니깐 스케쥴러에  의한 작업인듯 하네요.
그래서 혹시 문제 생길 하드를 먼저 교체를 하고 싶은데 저 정보로는 어떤 슬롯의 하드가 문제인지 확인이 어렵네요.

정안되면 돌아가면서 하드 교체 후 배드 검사를 일일이 하는 방법밖에 없을듯 하네요.
답변 감사합니다.
박문형 2023-08
LSI는 잘은 모르지만

3:1:7 과 3:1:8 만 에러가 떠 있다면 디스크 슬롯 넘버 7번과 8번 하드에 배드섹터들이 늘어난다고 볼 수 있습니다..

이게 갯수가 늘어나다가 어느 갯수 이상이 되면(몇개인지는 콘트롤러제조사마다 틀릴 것입니다..) 레이드 콘트롤러는 디스크 이상이다라고 생각합니다..

한두개 배드섹터가 생긴다고 레이드 콘트롤러는 디스크 이상이라고 하지 않습니다..

디스크도 여유섹터로 치환해 버릴 수 있으니까요..

그런데 여기서 조심해야 하는 점이 LSI 콘트롤러는 디스크 슬롯넘버가 아마도 0부터 시작할 것입니다..

즉 슬롯 넘버가 0~23까지 있다라고 봐야죠..

요건 제 추측이기에 100% 맞다라고 보기는 힘듭니다..



시스템 외관상으로 볼 때 디스크 LED가 빨간불이나 주황색 불이 나타나는 디스크는 안보이던가요??
 
제조사마다 틀리기에 자세한 것은 메뉴얼 봐야 하지만 보통 디스크 LED는 녹색이 정상 빨간색은 Fail 주황색은 이상 아니면 억세스 입니다..


레이드 데이터는 정확한 백업과 리스토어만이 살 길입니다..
     
naan 2023-08
아 7번과 8번 슬롯일수도 있겠네요. ( 네 위 이미지 보시면 0부터 시작입니다.) 의심가는 7,8번 먼저 작업 해봐야겠네요.
디스크 상태 LED 에는 특별하게 생에 변화가 없습니다. 그래서 확인이 어려운거구요

답변 감사합니다.
          
dateno1 2023-08
0부터 세던 1부터 세던간에 결국 7번 디스크는 문제가 있을 확율이 높습니다 (0부터 세면 7번이 8번 디스크가 되고, 1부터 세면 7번 디스크가 되니 어느쪽이든간에 로그에 있는 교체 대상이 됩니다)

좀 난폭한 방법인데 일단 고확율로 문제가 되는 7번을 볼름에서 제외시킨후 LED에 의존해서 해당 디스크를 확인후 (오프라인이 되면 표시가 바뀔껍니다) 교체를 진행해주세요

그리고 로그를 다시 보면 아마 7내지 8번 디스크 교체되었다고 뜰껍니다

이걸 이용해서 0부터 세는지 1부터 세는지 확인후 나머지 남은 디스크 하나도 교체해주세요

보통은 소프트에서 LED로 표시하는 기능이 있을껀데 위치 확인 기능이 없나요?

어느쪽이든간에 Pending이라 뜨는 디스크가 복수 존재하는건 상당히 위험한 상태라 보셔야 합니다 (특히 저런식으로 개별 디스크 용령이 테라단위 가는 경우 리빌드에도 10시간은 가볍게 꺠는경우가 대부분이라 그도중에 하나라도 더 나가면 데이터의 무결성을 보장할 수 없거나, 볼름이 깨져버릴 가능성도 있습니다)
epowergate 2023-08
LSI 프로그램을 보면 HDD LED를 깜빡거리게 하는 기능이 있습니다.
그걸로 위치 찾는게 제일 안전합니다

참고로
지금의 HDD 상태가 제일 까리 합니다.
서버벤더 또는 HDD 제조사 에서도 HDD가 AS 대상이다 아니다 가 갈립니다.
아직 HDD가 FAIL 상태가 아니기 때문에 AS 못해준다는 벤더.담당자 가 있습니다.
그냥 참고만 하세요
     
naan 2023-08
네 제일 문제가 이거죠 레이드카드상에서는 오류이지만 하드 툴이나 배드 검사 툴로 검사 해보면 이상없습니다.
A/S센터도 문제 없는 하드라고 A/S거부하는 경우가 많습니다.
박문형 2023-08
그 때는 무식하게 보일 수 있지만 로우레벨 포맷이나 제로필을 해서 전체 섹터를 하나하나 초기화해야 어느 정도 윤곽이 잡힙니다..

그렇게 작업을 해도 배드 있는 하드가 배드가 없어지기도 하고 배드가 없는 하드가 배드가 더 나오기도 합니다..

그리고 작업 전과 작업 후에 SMART 값이 변한다면 그것에 관해 무언가 나빠지고 있다고 보시면 됩니다..

레이드 장비는 정확히 백업과 리스토어 잘하시고 하드는 소모품이라고 생각하고 하드가 고장난 것은 디스크 베이에서 빨간불이 떨어질 때

라고 정의하는게 아무래도 편합니다..


QnA
제목Page 246/5711
2014-05   5163831   정은준1
2015-12   1698037   백메가
2023-09   1650   uuuu
2023-09   2698   2cpuin
2023-09   1826   연구실컴돌이
2023-09   1776   액체와컴퓨터
2023-09   1535   SentryGoing…
2023-09   1594   미르르
2023-09   1848   오준호5
2023-09   2051   전진
2023-09   3048   결비
2023-09   2420   sg굿즈스
2023-09   3458   행복하세
2023-09   2292   쌍cpu
2023-09   2502   전설속의미…
2023-09   1617   미수맨
2023-09   1765   박문형
2023-09   1464   angora79
2023-09   2076   2CPU최주희
2023-09   3579   댕대루
2023-09   2601   구차니
2023-09   2668   kallos