HP ADU의 리포트에
Smart Array P400 in slot 1 : Storage Enclosure 1 : Drive Cage on Port 1I : Physical Drive 1I:1:6 : Monitor and Performance Statistics
Serial Number 3NM8AL6L00009921XUJC
Firmware Revision HPDC
Product Revision HP DG146BB976
Reference Time 0x000183de
Sectors Read 0x00000005cc29e834
Read Errors Hard 0x00000033
Read Errors Retry Recovered 0x00000000
Read Errors ECC Corrected 0x0000000000000005
Sectors Written 0x000000000dec878d
Write Errors Hard 0x00000000
Write Errors Retry Recovered 0x00000000
Seek Count 0x0000000000000000
Seek Errors 0x0000000000000000
Spin Cycles 0x00000000
Spin Up Time 0x0000
Performance Test 1 0x0000
Performance Test 2 0x0000
Performance Test 3 0x0000
Performance Test 4 0x0000
Reallocation Sectors 0xffffffff
Reallocated Sectors 0x00000036
DRQ Time Outs 0x0000
Other Time Outs 0x0000
Drive Rebuild Count 2 (0x0002)
Spin Retries 65535 (0xffff)
Recovers Failed Read 0x0000
Recovers Failed Write 0x0000
Format Errors 0x0000
Self Test Failures 0x0000
Not Ready Failures 0x00000000
Remap Abort Failures 0x00000000
IRQ Deglitch Count 0 (0x00000000)
Bus Faults 0x00000000
Hot Plug Count 0 (0x00000000)
Track Rewrite Errors 0xffff
Write Errors After Remap 0x0000
Background Firmware Revision 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00
Media Failures 0x0000
Hardware Errors 0x0000
Aborted Command Failures 0x0000
Spin Up Failures 0x0000
Bad Target Count 0 (0x0000)
Predictive Failure Errors 0x00000144
를 표시하면서 적색LED가 점멸합니다.
구동은 문제없이 되고 있으나, 불안합니다.
SMART정보 관련 문제라고하나, 디스크를 다른 시스템에 붙혀서 검사하면 정상으로 나옵니다.
디스크를 교체하고, ADU상에서 온라인으로 리빌딩하는 동안에는 정상으로 나오다가
리빌딩이 완료되는 시점에서 다시 적색 LED가 점멸합니다.
구글검색으로는 펌웨어 업데이트를 권하는데, 그 방법이 맞을지 몰라서 질문올립니다.
(안되면 또 하루 서비스 중지하고, 밤을 새워야하는 상황이라서요..)
컨트롤러 펌웨어 CD 받는데 4시간소요된다고 해서 현재 받고는 있습니다.
디스크 펌웨어도 찾아보고 있습니다.(딱 맞는 펌웨어는 없네요..)
1차로 ERP와 홈페이지관리 업체쪽에 주요 데이터를 백업하라고 의뢰해놓았고,
작업전에 고스트나 트루이미지로 볼륨 전체를 백업하고 작업진행할겁니다.
3개월전 백업할때 2시간이 넘게 걸렸는데.. 이번에도 그 정도는 걸리겠죠... 에효....
이런 경우 해결해보신 분있으시면 방법 좀 알려주세요...
늘~~ 행복하셔야만 합니다!!
원인 찾기 애매하고
정확이 찾아서 해결되지 안는한
또다시 동일증상 생길것으로 유추 됩니다.
워런티 있으면야 HP에서는 얼마든지 하드 교체해 주겠지만
그것만은 답이 아닐텐데.........
저도 비슷한 경우가 다른 기종의 서버에서 생기고 있다보니
대략적인 생길수 있는 원인은
1.하드불량(근데 하드 교체해도 또 생기니 이건 아닌듯..)
2.백플레인 불량
3.케이블 불량
4.레이드 콘트롤러 불량
5.기타...'
일듯 하다고 AS에서는 얘기하네요.
하드 교체해도 3-6개월 지나면 또 하드 죽어 나간다
이게 저의 경험이네요.
서버 주고 1달간 부하 테스트 시켜도
추후 또 1년 정도면 하드 나감......
답 없을듯 해요.
그냥 본체 자체를 교체하심이 빠를듯..
도움이 못되어 죄송합니다.
그걸 권장 할겁니다. 그런데 사용자 입장에서는 위에분 말씀처럼 디스크 빼고
싹 바꾸는게 가장 좋습니다. 유지보수 계약이 되어있다면...
HP 모델들 많이 만져봤는데 G5-G6가 펌웨어가 욕나올정도로 심각합니다. 반드시 최종 펌웨어와 드라이버로 올려야 하며 올리지 않았을경우에는 3개월에 한번씩 6개월에 한번씩 1년에 한번씩 이유없이 리부팅 됩니다. 그리고 고장나지도 않았는데 고장났다고 LED 점등 들어오구요.
G7도 초기에는 잘나가다가 반년 지나니까 초기펌웨어가 말썽을 일으키더라구요.
HP 모델들이 펌웨어 이슈를 벗어나지 못한데서 좀 문제가 크지 않았나 합니다.
펌웨어 이슈 아니였으면 x86의 정말 모범이 되는 서버인것은 확실합니다. 그래도 전 HP 서버들이 너무 좋아라 합니다. 정말 잘만든거 같아요. 펌웨어가 엿먹이지만 않는다면요
그 전에 먼지 청소는 기본..
BBU도 잘 동작하는 것으로 갈아야 겠죠..
Firmware Update DVD 보다는
SPP DVD 받는걸 추천 합니다.
(Firmware Update DVD 는 갱신이 안되는것으로 알고 있습니다. 마지막 버전이 10.10인가... 몇년전에 나온거..)
낮은 Firmware Version 에서는 Logical Volume Crash 가 정말 많이 발생 합니다.
(디스크 불들어오면 다른 서버에 꼽았다가 어레이 만들고 다시 지우고 다시 원복하면 되요..)
결론은 Firmware 문제가 대부분..
그리고 Array Controller Firmware Update 했다고 끝이 아닙니다.
Disk Firmware 도 신경 쓰셔야 합니다... (13년 11월인가 12월에 Disk Firmware 우루르 나왔습니다.)
Disk Firmware 는 Cache Memory 와 BBWC 가 있다면 Online 에서 Update 가능 합니다.
자신의 정보를 절대 노출시키지 않는듯......
말이 AS 센터지
국내 HP AS 는 90% 가 파트너 업체 통하여 이루어 집니다.
나머지 10% 는 HP Korea 엔지니어 분들 이구요.
(계약 레벨이 높아야 HP Korea 엔지니어 가 갑니다.)
서울 경기 지역은 한 업체가 HP 랑 계약 했고..
해당 업체에서 잘하는분은 잘하는데 못하는분은 CPU 브라켓을 고정못하고
억지로 닫다가 CPU 핀 뿌러트려 먹은 사람도 있습니다.
그래서 전 제가 바쁜경우 아니면 HP 에서 Part 만 받아서 직접 교환 합니다...
펌웨어 업데이트 진행하고, 이상이 지속적으로 발생되면 서버자체를 업그레이드하는쪽으로 밀어야겠습니다.
웹서버랑 DB서버인데.. DB서버쪽도 항시 메모리부족이라 업그레이드를 고민중이였거든요.
비용지불해야하는 입장에서는 무조건 고치라고 하겠지만, 정 안되면 유지보수연장을 제가 거부할까싶기도 합니다.
일단 펌웨어쪽 진행해보겠습니다. 도움 감사합니다.
해당 디스크 다른데서 이상없으면 그것 꼭 확인해보세요.