아래 5805z 에러에대한 log입니다.

realhin   
   조회 9246   추천 0    

Support.zip (408.4K), Down : 12, 2017-12

이선호님이 친절하게 log 뽑는 방법을 알려주셔서

이렇게 올려봅니다.

도움이 절실하게 필요합니다. 

살려주세요~ 

박문형 2017-12
대략 보니 두번째 하드 (ID1)가 계속 에러가 많이 나서 콘트롤러가 감당 못하고 뱉어내고 핫스페어로 리빌딩 중인 듯합니다..
     
realhin 2017-12
아 그런가요? ㅜㅜ 하드교체를 해야되는군요... 감사합니다.
이선호 2017-12
질문은 Q&A로... 부탁합니다.
조금 있다 자세히 보겠지만, 전체적으로 굉장히 불안정하네요. 전체적으로 갈아엎으셔야 할것으로 보입니다.
CMD abt가 19399면 사실상 한참 전에 교체했어야할 HDD입니다.

또한 RAIDCARD 쿨링이 전혀 안되고 있습니다. 팬 무조건 달아주셔야합니다.
     
realhin 2017-12
죄송합니다. 다음부턴 게시판에 맞게 글 올리겠습니다.
싹 갈아엎... 는건 하드교체를 말씀하시는거겠죠?
쿨링... 아... 네 팬이 없긴없어요...
제가 엉망으로 쓰고있다는거네요 ㅜㅜ
조언 너무 감사합니다.
박문형 2017-12
케이블이 아답텍 케이블이 아닌가 봅니다..

아답텍 카드를 에러 없이 사용할려면 아답텍 케이블이 거의 필수 조건입니다...

쿨링 없이 5805 사용하다가 코어가 타버리는 경우가 왕왕 있습니다..
     
realhin 2017-12
케이블은 모르겠어요... 약간 투명한 은색같은 케이블이었는데...
쿨링팬을 얼른 달아줘야겠네요 ㅜㅜ
조언 감사합니다.
elkiselee 2017-12
혹시 저전력하드 쓰시나요?
     
realhin 2017-12
아뇨 저전력하드는 아니예요.
          
elkiselee 2017-12
하드에 사용중 데이터 입출력이 없으면 작동을 멈추는 기능이 있는 하드 인가요?
               
realhin 2017-12
그... 건 자세히는 모르겠어요...
도시바3테라 하드예요.
상세한 기능까지는 ... 제가 이쪽으론 너무 무지해서...
                    
elkiselee 2017-12
cmd abt가 많은게 저는 그증상이여서요

아이들 상태에서도 항상 하드를 돌게하는 기능이 5xxx 부터 있거든요 활성화해보세요
                         
realhin 2017-12
저...cmd abt가 먼지도 몰라요.ㅜㅜ
그 기능이... 있는지도... 어디있는지도 모르는 무지한 저한테는...
일단 박문형님이 한글 메뉴얼을 주셨어요.
급한불 꺼보고 메뉴얼 정독해보면서 하나하나 해볼께요.
신경써주셔서 너무너무 감사합니다.
                         
이선호 2017-12
HDD가 멈추는 기능때문에 cmb abt가 생기는게 아니라, 통신상의 문제나 응답 자체가 느려서 에러가 나는게 대부분입니다.
저전력 HDD라는것 자체가 따로 존재하지는 않고, WD EARZ (예전 그린모델) 자체가 문제들이 좀 있었습니다.
Reduce rpm도 미지원했었고, full rpm에도 워낙에 에러들이 많았습니다.

특히 WD20EARZ.......
오히려 깡통카드를 쓰면 에러율이 적을겁니다.
               
elkiselee 2017-12
아 제 댓글이 확정적으로 써졌는데 원래는 이선호님 설명이 정확하고요

저의 예전 QnA에 CMD abt수치가 하드 1개당 10000번이넘게, 하드 8개가 다 그런적이 있었거든요 7일만에

WD green도 그렇고 HGST 데스크스타도 그렇고

3xxx에서 5xxx 시리즈로 바꾸고 아이들상태에서 항상켜짐으로  했더니 지금 2년째 문제가 없어서

한번 알려드렸어요 스토리지 관리하시는분들은 좋은하드 쓰니까 저같은 문제를 겪은적 없으시겠지만

저는 저렴한 하드를 써야하는 일반인 이여서 ㅋㅋ
                    
realhin 2017-12
저도 일반인... raid 지식이 거의없는 일반인이라...
사실 리플달아주신분들이 말씀해주신 내용에서
반에반도 제대로 이해를 못하고있어요. ㅜㅜ
리플 달아주신 모든분들 정말 감사합니다.
정말 너무너무 고맙습니다.
박문형 2017-12
셋팅하고 몇 년 사용하셨나요??

한글 메뉴얼은 여기에서

http://www.2cpu.co.kr/PDS/9577?&sfl=wr_name%2C1&stx=%B9%DA%B9%AE%C7%FC&sop=and
     
realhin 2017-12
아! 한글 메뉴얼! 감사합니다~!
셋팅...한 3년 된거같은데요... 정확하지는 않아요.
박문형 2017-12
3년 풀로 돌렸으면 하드가 고장날 때가 되었죠..
     
realhin 2017-12
아... 그런가요...
일단은 검증끝내보고 하드교체쪽으로 가닥을 잡아봐야할거같네요...
근데 저 에러는 뭔지도 모르겠고... 무섭네요 저거...
박문형 2017-12
에러라고 보기는 힘들고요..

다행히 오래 돌렸지만 하드 하나 고장나서 리빌드 중이라고 보여집니다..

(하드 2개 고장나서 레이드 데이터가 안보이거나 완전히 스탑될 때를 저는 사고라고 보기에)

아답텍 레이드 관리 유틸도 버그가 있는게 있으니 펌웨어 버젼과 관리 유틸 버젼을 맞춰 줘야 합니다..

그것에 관해서는 앤디코에게 문의해보세요..
     
realhin 2017-12
아~ 그런가요?
일단 작동중인게 다행인거네요...
빨리 쿨링팬 부착하고 하드교체를 해야겠네요.
바쁘실텐데 조언 너무너무 감사드립니다.
이선호 2017-12
에러라고 봐야합니다.
일단 입출력이 없다고 자동으로 HDD가 멈추는 기능은 기본으로 들어가지 않습니다. 전력관리 설정을 하지 않는 한 절대로 기본으로 들어가지 않지요.
FM대로 한다면 전력관리 기능은 아예 쓰지 않는게 정상입니다. 또한 하드 자체는 Full rpm, reduce rpm, pwr off 전부 지원하나 세팅은 full rpm으로 되어있네요.

두번째로, adaptec 5시리즈는 상대적으로 민감도가 낮은 편입니다. 5시리즈에서 저 수치라면 잘못되어도 한참 잘못된것이 맞습니다.

HDD 불량 또는 케이블 불량 + 비정상적인 온도로 인한 컨트롤러 에러 확률이 제일 높다고 봅니다.
cmd abort가 pwr state 에 따라 어느정도 올라갈 수 있다고는 봅니다만, 100대가 넘어가면 일단은 문제가 있는 상황이고, Device ID 1번을 제외하고는 전 HDD에 medium err가 상당히 있는 상태입니다. 심지어 device ID 1번은 SMART err까지 있는 상황이네요.

저희 회사 백업 서버나 홈서버에 달린 7시리즈 모두 medium err은 전부 0이고, cmd abort정도만 높아봐야 10 나오는 수준입니다.
볼륨 생성한지는 4~5년정도 된것들이 많고, 7시리즈가 굉장히 민감한걸 감안하면 이정도 수치는 매~우 양호한것이지요. 또 이게 정상이지요

일단 RAID는 백업이 아니기에 백업본을 항상 유지하시고, HDD 전부 교체하셔야 할것으로 보입니다.
     
realhin 2017-12
엌... 에러가 맞나요???
어우...
일단 하드교체, 쿨링팬 설치를 진행할려고하는데... 케이블도 문제가있나요?....
모르면 맞아야 된다고... 이렇게 연말에 제대로 맞네요... ㅜㅜ
우선 하드랑 쿨링팬 해보고 케이블교체도 고려해봐야겠네요.
세심하게 글올려주셔서 너무너무 감사드립니다.
혹시 다음번에 글 올리게될때는 게시판 맞춰서 올리겠습니다.
다시한번 감사드립니다. 고맙습니다.
          
이선호 2017-12
케이블이 Coms나 타사제품인가요? 보통은 문제가 없지만, 뽑기운으로 문제가 생기는 경우도 꽤 있습니다.
카드 발열때문에 문제가 생겼을 가능성도 상당히 높은 편이구요.

DT01ACA300도 10개 넘게 사용중이고, ST3000DM001은 수십개 사용중입니다.
어정쩡하게 문제생길 하드들은 아닙니다. (이번에 3TB에서 8TB HDD로 거의 다 갈아엎었지만, HDD들 모두 매우 멀쩡합니다.)

일단 백업부터 하신 후에 하나씩 짚어보시는게 좋을듯합니다.
2018년 액땜했다고 생각하시면 더 좋지 않을까 싶습니다 :)
               
realhin 2017-12
케이블이 어디껀지 모르겠어용...
여기에서 중고품으로 산거거등요...
저도 도시바하드가 괜찮다고 생각해서 그걸로 셋팅한건데
어디에서 문제가 터진건지 모르겠어요.
모르니까 맞아야죠뭐 ㅜㅜ
너무 감사합니다 이선호님.
세세하게 알려주시는 부분... 솔직히 다 이해는 못하고있지만...
그냥 넘어가도 될텐데 자세히 설명해주시고.... 너무 고맙습니다.
다시한번 감사드립니다.
박문형 2017-12
대략

리빌딩이 끝나면 컴퓨터 끄지 마시고  (저런 상태에서 껐다 켰다하다가 날라가는 경우가 왕왕 있습니다.)

데이터 백업을 빨리 해두시는게 좋아 보입니다..
     
realhin 2017-12
네 일단 오늘은 그냥 놔두고 내일 하드랑 팬사서 해보려합니다.
무지한 유저를 위해 이렇게까지 신경써주셔서 너무 감사드립니다.
박문형 2017-12
cmd abort 에러는 나면 안 좋은 것인데 이거 많이 나면 우선 케이블 호환성 불량이나 불량으로 봅니다..

그리고 하드 많이 달린 레이드 시스템은 쿨링도 좋아야 하지만 파워도 튼튼해야 합니다...

그래야 하드도 오래가고(고장이 적고) 전체적인 시스템도 오래 갑니다..

저도 집에서는 하드 7-8개씩 달아 사용합니다만 (하드 1개 다 차면 새하드 사서 달고 하는 식으로)

대략 재일 오래된 하드는 5년 쯤 되어 가네요..

케이스는 요거 700와트 옛날 버젼 사용 중입니다.. (만들고 약 7년째 아무 문제 없이 사용 중)

https://www.supermicro.com.tw/products/chassis/4U/745/SC745TQ-R920B

개인에게는 새 제품이 상당히 비쌀수 있으나 재대로 오래 사용하면 꽤 오래 사용이 가능합니다..
     
realhin 2017-12
케이블 문제일수도있겠네요...
이거 여기에서 중고로 산거거든요...
케이블이 정품인지 아닌지는 솔직히 잘 모르고산거구요.
잘 써왔는데 갑자기 이렇게 문제가 터져서
경황없는 상태에서 물어볼데가 여기밖에 없더라구요... 자주들러서 눈팅하는 사이트이기도 하고요.
파워는 저전력 cpu에 500w 슈플 제품쓰는데 파워가 그리 허접하진않을거같은데...
솔직히 잘 모르겟네요. ㅜㅜ 어디가 문젠지... 모르니까 맞는거라 생각합니다.
정말이지 리플달아주신 모든분들 너무너무 감사합니다.
어디서 이렇게 전문적인 조언을 받을수있을까요...
다시한번 모든분들 감사드립니다. 고맙습니다. ㅜㅜ




제목Page 3/37
10-15   993   회원K
2014-05   2607997   정은준1
03-16   5447   캔위드
03-12   5818   dongcheol
03-11   4684   독고탁
03-07   5273   Atmosphere
03-06   4773   구름빵
03-01   4241   회원K
02-19   5797   올닉스
02-08   7516   minsuk
02-02   6499   규현
01-29   7745   규현
01-26   8264   ACTORUK
01-22   7684   LikeTree
01-21   6339   LikeTree
01-19   6175   ApertureSci…
01-19   5408   봉래
01-12   7118   회상2
2017-12   7433   yongal2
2017-12   7108   realhin
2017-12   9247   realhin
2017-12   6425   realhin