HP DL380 G5 : Warning Predictive failure. 문제 해결방법에 대하여..

   조회 17645   추천 0    

P400에 물린 2.5 SAS Disk가 자꾸 죽어서 확인해보니, 

HP ADU의 리포트에 

Smart Array P400 in slot 1 : Storage Enclosure 1 : Drive Cage on Port 1I : Physical Drive 1I:1:6 : Monitor and Performance Statistics

   Serial Number                        3NM8AL6L00009921XUJC
   Firmware Revision                    HPDC
   Product Revision                     HP      DG146BB976      
   Reference Time                       0x000183de
   Sectors Read                         0x00000005cc29e834
   Read Errors Hard                     0x00000033
   Read Errors Retry Recovered          0x00000000
   Read Errors ECC Corrected            0x0000000000000005
   Sectors Written                      0x000000000dec878d
   Write Errors Hard                    0x00000000
   Write Errors Retry Recovered         0x00000000
   Seek Count                           0x0000000000000000
   Seek Errors                          0x0000000000000000
   Spin Cycles                          0x00000000
   Spin Up Time                         0x0000
   Performance Test 1                   0x0000
   Performance Test 2                   0x0000
   Performance Test 3                   0x0000
   Performance Test 4                   0x0000
   Reallocation Sectors                 0xffffffff
   Reallocated Sectors                  0x00000036
   DRQ Time Outs                        0x0000
   Other Time Outs                      0x0000
   Drive Rebuild Count                  2 (0x0002)
   Spin Retries                         65535 (0xffff)
   Recovers Failed Read                 0x0000
   Recovers Failed Write                0x0000
   Format Errors                        0x0000
   Self Test Failures                   0x0000
   Not Ready Failures                   0x00000000
   Remap Abort Failures                 0x00000000
   IRQ Deglitch Count                   0 (0x00000000)
   Bus Faults                           0x00000000
   Hot Plug Count                       0 (0x00000000)
   Track Rewrite Errors                 0xffff
   Write Errors After Remap             0x0000
   Background Firmware Revision         0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
   Media Failures                       0x0000
   Hardware Errors                      0x0000
   Aborted Command Failures             0x0000
   Spin Up Failures                     0x0000
   Bad Target Count                     0 (0x0000)
   Predictive Failure Errors            0x00000144         

를 표시하면서 적색LED가 점멸합니다. 

구동은 문제없이 되고 있으나, 불안합니다.

SMART정보 관련 문제라고하나, 디스크를 다른 시스템에 붙혀서 검사하면 정상으로 나옵니다.

디스크를 교체하고, ADU상에서 온라인으로 리빌딩하는 동안에는 정상으로 나오다가 
리빌딩이 완료되는 시점에서 다시 적색 LED가 점멸합니다.

구글검색으로는 펌웨어 업데이트를 권하는데, 그 방법이 맞을지 몰라서 질문올립니다.
(안되면 또 하루 서비스 중지하고, 밤을 새워야하는 상황이라서요..)

컨트롤러 펌웨어 CD 받는데 4시간소요된다고 해서 현재 받고는 있습니다.
디스크 펌웨어도 찾아보고 있습니다.(딱 맞는 펌웨어는 없네요..)

1차로 ERP와 홈페이지관리 업체쪽에 주요 데이터를 백업하라고 의뢰해놓았고,
작업전에 고스트나 트루이미지로 볼륨 전체를 백업하고 작업진행할겁니다.
3개월전 백업할때 2시간이 넘게 걸렸는데.. 이번에도 그 정도는 걸리겠죠... 에효....

이런 경우 해결해보신 분있으시면 방법 좀 알려주세요...
늘~~ 행복하셔야만 합니다!!
짧은글 일수록 신중하게.
노리 2014-01
서버 본체를 바꾸는것이 빨라 보입니다.

원인 찾기 애매하고
정확이 찾아서 해결되지 안는한
또다시 동일증상 생길것으로 유추 됩니다.

워런티 있으면야 HP에서는 얼마든지 하드 교체해 주겠지만
그것만은 답이 아닐텐데.........



저도 비슷한 경우가 다른 기종의 서버에서 생기고 있다보니
대략적인 생길수 있는 원인은
1.하드불량(근데 하드 교체해도 또 생기니 이건 아닌듯..)
2.백플레인 불량
3.케이블 불량
4.레이드 콘트롤러 불량
5.기타...'
일듯 하다고 AS에서는 얘기하네요.


하드 교체해도 3-6개월 지나면 또 하드 죽어 나간다

이게 저의 경험이네요.

서버 주고 1달간 부하 테스트 시켜도
추후 또 1년 정도면 하드 나감......


답 없을듯 해요.

그냥 본체 자체를 교체하심이 빠를듯..



도움이 못되어 죄송합니다.
박병국 2014-01
이런 경우 가장 쉽게 시도해볼 수 있는게 펌웨어 드라이버 작업이라 HP에서도
그걸 권장 할겁니다. 그런데 사용자 입장에서는 위에분 말씀처럼 디스크 빼고
싹 바꾸는게 가장 좋습니다. 유지보수 계약이 되어있다면...
김윤술 2014-01
G5라면 지옥의 펌웨어 모델들이군요. 펌웨어 문제가 90프로이구요 나머지가 다른문제로 보시면 됩니다.
HP 모델들 많이 만져봤는데 G5-G6가 펌웨어가 욕나올정도로 심각합니다. 반드시 최종 펌웨어와 드라이버로 올려야 하며 올리지 않았을경우에는 3개월에 한번씩 6개월에 한번씩 1년에 한번씩 이유없이 리부팅 됩니다. 그리고 고장나지도 않았는데 고장났다고 LED 점등 들어오구요.
G7도 초기에는 잘나가다가 반년 지나니까 초기펌웨어가 말썽을 일으키더라구요.
HP 모델들이 펌웨어 이슈를 벗어나지 못한데서 좀 문제가 크지 않았나 합니다.
펌웨어 이슈 아니였으면 x86의 정말 모범이 되는 서버인것은 확실합니다. 그래도 전 HP 서버들이 너무 좋아라 합니다. 정말 잘만든거 같아요. 펌웨어가 엿먹이지만 않는다면요
박문형 2014-01
콘트롤러와 케이블의 교환을 권장해드립니다.

그 전에 먼지 청소는 기본..

BBU도 잘 동작하는 것으로 갈아야 겠죠..
우앙뿌앙 2014-01
P400 이시면 일단 7.24 Firmware 만드시구요.

Firmware Update DVD 보다는

SPP DVD 받는걸 추천 합니다.

(Firmware Update DVD 는 갱신이 안되는것으로 알고 있습니다. 마지막 버전이 10.10인가... 몇년전에 나온거..)


낮은 Firmware Version 에서는 Logical Volume Crash 가 정말 많이 발생 합니다.

(디스크 불들어오면 다른 서버에 꼽았다가 어레이 만들고 다시 지우고 다시 원복하면 되요..)


결론은 Firmware 문제가 대부분..

그리고 Array Controller Firmware Update 했다고 끝이 아닙니다.

Disk Firmware 도 신경 쓰셔야 합니다... (13년 11월인가 12월에 Disk Firmware 우루르 나왔습니다.)


Disk Firmware 는 Cache Memory 와 BBWC 가 있다면 Online 에서 Update 가능 합니다.
노리 2014-01
이 사이트 분명 HP AS센터분도 보시는 분이 계실텐데....
자신의 정보를 절대 노출시키지 않는듯......
     
우앙뿌앙 2014-01
HP AS 센터 별거 없습니다.

말이 AS 센터지

국내 HP AS 는 90% 가 파트너 업체 통하여 이루어 집니다.

나머지 10% 는 HP Korea 엔지니어 분들 이구요.
(계약 레벨이 높아야 HP Korea 엔지니어 가 갑니다.)

서울 경기 지역은 한 업체가 HP 랑 계약 했고..

해당 업체에서 잘하는분은 잘하는데 못하는분은 CPU 브라켓을 고정못하고

억지로 닫다가 CPU 핀 뿌러트려 먹은 사람도 있습니다.


그래서 전 제가 바쁜경우 아니면 HP 에서 Part 만 받아서 직접 교환 합니다...
역시 2CPU입니다. 감사합니다.

펌웨어 업데이트 진행하고, 이상이 지속적으로 발생되면 서버자체를 업그레이드하는쪽으로 밀어야겠습니다.

웹서버랑 DB서버인데.. DB서버쪽도 항시 메모리부족이라 업그레이드를 고민중이였거든요.

비용지불해야하는 입장에서는 무조건 고치라고 하겠지만, 정 안되면 유지보수연장을 제가 거부할까싶기도 합니다.

일단 펌웨어쪽 진행해보겠습니다. 도움 감사합니다.
배준석 2014-01
백플레인/케이블 불량 은근히 많습니다.

해당 디스크 다른데서 이상없으면 그것 꼭 확인해보세요.


QnA
제목Page 3310/5727
2015-12   1779746   백메가
2014-05   5254829   정은준1
2014-01   16950  
2014-01   4026   뮤노
2014-01   4053   이정근
2014-01   4995   방o효o문
2014-01   4185   윈도우10
2014-01   12468   송지만
2014-01   3944   Olorin
2014-01   4766   김황중
2014-01   4500   황진우
2014-01   5449   빠시온
2014-01   4442   안정석
2014-01   5765   방o효o문
2014-01   11871   2CPU최주희
2014-01   23831   인천I베리
2014-01   44612   Astronaut
2014-01   8583   병따개님
2014-01   4287   김민성
2014-01   5346   범범이
2014-01   4160   병맛폰
2014-01   4406   김민성