아레카 레이드 구성시 에러 이벤트 발생

   조회 9949   추천 0    

안녕하세요 레이드 구성하기 넘 힘이 드네요 ㅠㅠ

 

우선 1TB짜리 8개로 레이드5+1로 구성중입니다 레이드는 아레카입니다.

 

아레카 레이드 구성화면에서 구성하고 이니셜라이징 중이였습니다.

 

17일 5시쯤에 시작했는데 18일 잘 되고 있었구요 19일날 와 보니 서버에서 "뚜뚜뚜뚜" 소리가 계속 나오더군요

이소리는 저번에 레이드가 깨졌을때 나던 소리던데 그때 레이드 삭제하니 소리가 없어 졌거든요

놀란 맘을 안고 가서 확인해 보니 5번 하드 "드라이브 실패"란 이벤트가 발생했더군요 

그러더니 8번 하드로 "rebuliding start" 했다는 이벤트가 나오고 rebuliding하고 있더라구요

그래서 5번 하드 교체를 할려고 하려다가 rebuliding을 하니깐 그냥 다 되면 하드교체를 해야겠다 생각하고

32%밖에 안 되어서 퇴근 후 다시 20일 그러니깐  오늘 와 보니 3번하드 "read error"란 이벤트발생되었더군요

근데 rebuliding은 계속 진행중이구요 지금 84.6% 진행되었습니다. "뚜뚜뚜"소리는 계속 나고요

 

근데 rebuliding 속도가 넘 느리네요 2시간 지났는데 2%된것 같은데....3번 하드 error때문일까요?

 

그리고 이 상태에서 rebuliding다 될때까지 기다려 봐야 되나요?

 

아님 에러난 하드 교체하고 다시 레이드 구성해서 이니셜라이징 해야 하나요?

 

일단 OS랑 기타 다른 사항들은 다 설치 된 상태구요 이니셜라이징이 안되어서 그런지 os에서 하드 인식이 안되고

 

있거든요....이니셜라이징 없이 그냥 인식 시킬 방법은 없나요? 저 과정은 필수 인가요?

 

이 서버는 무슨 이유 때문인지 사용안하고 있던 서버더군요 그래서 이번에 스토리지 증설로 인해 사용하려고 서버를 on시키니 "뚜뚜뚜"소리가 나서 레이드 깨고 지금 1TB로 하드 바꾸고 작업하고 있는 중이거든요

 

혹 레이드 카드가 문제인지...원래 이렇게 시간이 오래 걸리는지??? 17일 시작해서 20일...4일동안 그리고 지금 상황으로 봐서는 오늘도 완료되기 힘들듯 한데....레이드 구성은 첨해보는것이라 참 생소하고 힘드네요

 

이렇게 긴 시간을 보내고 완료되었는데 또 안되기라고 하면..실망이 넘 클것 같기도 하고 ㅎㅎㅎ

 

답변 부탁드립니다. 그리고 즐거운 주말 보내세요~~~~~

 

 

 

짧은글 일수록 신중하게.
조우연 2010-08
일단. raid 5, 5EE 상태에서 디스크 한개가 fail 되는 상황이 발생하면 해당 디스크는 오프라인으로 떨어져 더이상 사용이 되지 않으며, 나머지 하드에 있는 parity 값을 조합하여 리빌드를 하는 것이기 때문에 문제가 있는 하드를 넣어두건 아무런 이득이 없습니다.

리빌드 시간은 컨트롤러 성능에 따라 좌우되며, 디스크가 대용량이거나 컨트롤러가 구형일 경우. 1주일 이상도 걸릴수 있습니다. 하루 이틀 정도 리빌드 한다고 문제가 되지는 않습니다. 문제는 리빌드 과정중에 다른 디스크에 또 에러가 발생했다는 점인데. 기본적으로 raid 5는 하나의 디스크의 fail over(장애극복)만 가능하기 때문에, 2개 이상의 하드에 문제 발생시 데이터가 손실될수 있습니다.

일단 리빌드가 중단되지 않고 계속 진행이 되는것으로 봐서는 일시적 오류이거나 일부 파일에만 손상이 생길것으로 예상되며, 현 리빌드가 완료된후. 반드시 문제가 발생헀던 3번 디스크를 교체후 새롭게 리빌드를 진행하시기 바랍니다.

그리고 왜 접근이 안되는 상태인지는 직접 볼수 없기 때문에. 알수 없으나 정상적인 서비스 상태에서 리빌드로 떨어진것이라면 하드에 접근가능한게 정상입니다.
     
개별교습 2010-08
답변 감사드립니다
지금 또 하드 6번에서 "read error" 났고 그래도 리빌드는 계속 진행 중입니다.
리빌드가 끝나고 나면 3번과 6번을 교체하고 리빌드를 다시 하라고 말씀하셨는데.
그럼 시간이 또 상당히 걸릴것 같은데요 지금 이상태에서 레이드 깨고 하드 교체후 다시 레이드 잡는게 어떤지??
"그리고 왜 접근이 안되는 상태인지는 직접 볼수 없기 때문에. 알수 없으나 정상적인 서비스 상태에서 리빌드로 떨어진것이라면 하드에 접근가능한게 정상입니다" 이 말이 혹시 하드 인식안된다는 질문에 답변인지요???
지금 상황이 OS는 기존에 깔려 있던 OS 그대로 사용하고 있습니다.
기존에는 500G하드로 레이드를 구성했는데 1TB 하드 전원 교체 되고 되어서 혹시 하드 인식이 되지 않는 걸까요?
그럼 OS도 새로 깔아야 하는지??
또 read error는 하드의 물리적 오류때문에 발생하는 오류인가요?
하드 교체후 기존의 하드는 사용할 수 없는 건가요?
1TB 8개는 17일날 작업 시작하면서 다 새로 산 하드라서 오류가 한개가 아니라 지금 3개나 나니깐 혼돈스럽네요 ^^ 레이드가 문제 있어서 서버 사용을 안하고 있었던게 아닌가 하는 생각도 드네요 ^^
내일부터 휴가인데....휴가 취소 되었습니다 ㅠㅠ 이렇게 오래 걸릴줄은 미쳐 몰랐네요..
아 그리고 이 과정이 필수 과정인가요?? 왜냐면 예전 서버 관리자와 같이 가서 작업 도와줬던 분이 그때는 레이드 구성은 하루만에 그리고 데이타 백업이 2~3일 걸렸다면서 그런 말을 하길래....^^
아레카는 Version 1.20.0X.13 이 버전인데 한 2년에서 3년정도 된 레이드 카드 입니다.
박문형 2010-08
모든 것을 다 채크해야 되는 상황입니다.
카드의 포트가 죽엇는지
카드의 바이오스가 하드와 맞는지
케이블 불량이 나는지
하드가 오래 된 것이라면 개별 로우포맷을 하고 한번 걸러서 사용하세요.
그 외 전원 부족으로 옥수수 알갱이 빠지듯이 이리저리 하드 빠지는 경우도 있습니다.

저런 것은
많이 다루어 본사람도 직접 만져서 한 1주일 고생해봐야 감이 옵니다.
개별교습 2010-08
조우연님 제 질문에 방식이 기분 상하셨다면 죄송합니다.
전 프로그래머입니다 그래도 경력7년은 됩니다 그래서 로그조차 뽑을 줄 모르는 바보는 아니고 무턱대로 저 편하
자고 예의없이 질문 올리는 사람은 아닌데....
어찌 어찌 하다보니 지금 서버도 맡게 되었는데..제 분야가 아니다 보니 한개 궁금하던것이 꼬리에 꼬리를 물어 너무 요점없고 방대한 질문이 된 점 사과드립니다.
변명을 하자면 작업을 리눅스상 CLI에서 하는것이 아니라 부팅하고 시몬스상태(맞는지 모르겠네요??)에서 작업을 하고 있습니다 단순히 "이벤트발생뷰어"에서 발생하는 로그를 보면서 질문드린건데 거기에는 에러코드가 안 나오고 위에 질문 한것처럼 단순히 "날짜 시간 IDE Channel 3 read error" "날짜 시간 IDE Channel 6 read error" 그리고 "날짜 시간 IDE Channel 5 drive fail" 이라고 떠서 이렇게 에러 내용을 알려 드리면 되는줄 알았습니다. 또 생각이 넘 겉잡을 수없이 많아져서 질문의 요점을 파악못하고 질문드렸는데 조우연님 말씀이 리빌드 완료후에 read error가 난 3번하드를 교체하고 다시 리빌드 하라고 말씀하셔서 제 짧은 생각에는 리빌드하는데도 시간이 많이 걸리니깐 이 에러가 물리적 에러가 아니라면 다시 레이드 풀고 묶는 시간이랑 리빌드 하는 시간이랑 비슷하지 않을까 그렇다면 5번 하드도 새걸로 교체해서 다시 레이드 묶을까 라는 생각을 하다보니 read error가 물리적 하드인지 아닌지를 질문드린것입니다. 근데 님 말대로 제가 다시 질문을 읽어봐도 좀 답답한 질문이네요^^
또 아레카 레이드 카드는 뚜껑을 안 열어보고 단순히 dmesg에서 벤더 부분에서 찾아 올린것입니다..확인하는 방법을 이것 밖에 몰라서 ^^......
여하튼 많은 도움 되었습니다....그리고 앞으로 좀 더 생각하고 질문글 올리도록 하겠습니다.
즐거운 주말 되세요~~~^^
개별교습 2010-08
박문형님 답변 감사합니다.
처음에 1TB 하드를 꽂을때 꽂고 난 후 레이드구성하고 구성하는 화면에서 나올려고 save&reboot 하고
다시 시스템 시작되는데 하드가 8개중 5개가 인식 안되던요...그래서 전원 끄고 다시 하드 포트 뺐다가 다시 꽂으니깐 8개 다 인식되어서 작업 시작 했는데요..이런 현상이 전원부족과 관련이 있을까요???
또 님이 말씀하신부분 체크 해 보겠습니다. 감사합니다. 즐거운 주말 보내세요~~
박문형 2010-08
우선 시스템 앞면 사진, 뚜껑 열고 윗면 사진, 카드 사진 백플레인 사진
정도면 있으면 대략 무엇을 채크해야 할지 알수가 있습니다.
하드를 새것으로 구하셨는지 아니면 중고인지도 알아야 하며
느낌상 시스템이 3-5년 정도 되어 보입니다.

나이든 시스템일수록 하드웨어적으로 관리하기 어렵습니다.
정의석 2010-08
레이드 구성후 리부팅할 때 디스크 몇개가 제대로 인식이 안되었다면 전원문제일수도 있을거 같네요.
저도 얼마전에 같은 증상을 겪었었거든요.
단순히 파워의 용량이 현재 구성되어있는 시스템의 용량보다 크다고 할지라도,,
파워에 lane(?)이라는게 있는데,12V, 5V등,,, 중에서 어느 한쪽이 모자랄 수 있습니다.
혹은 같은 12V쪽 파워선이라도 너무 한쪽에 몰리면 안되는 경우도 있구요..(요즘 파워는 괜찮다고도 하지만요...)
일단 파워를 더 높은걸로 해 보시거나(높은 용량 파워는 비싸서,,,) 아니면 PC용 파워라도 하나 구해서 하드디스크쪽에만 붙여보세요.


QnA
제목Page 3986/5724
2015-12   1763345   백메가
2014-05   5237634   정은준1
2010-08   9407   김정중
2010-08   8887   김주용s
2010-08   11097   이종송1
2010-08   24113   김윤술
2010-08   15210   스윗가이
2010-08   8129   백문불여일견
2010-08   8253   김태성
2010-08   8683   2CPU최주희
2010-08   16240   우우씨씨씨
2010-08   8704   박상범
2010-08   9533   김승현
2010-08   10599   스윗가이
2010-08   10643   과거지사
2010-08   8690   남성룡
2010-08   10113   홍상훈
2010-08   8441   소주한병
2010-08   10430   미녀와확고…
2010-08   9204   아름다운노을
2010-08   10864   ZEBE
2010-08   12003   양창권