X3650 프리징 및 재붓

LUNA   
   조회 4398   추천 0    

 안녕하세요 X3650 (m1 7979IKR)사용하는 한 유저입니다. 현재구성은 24g(2*12g pc2 fb-dimm)에 e5420*2 입니다. 다반 사용줄 불특정하게 포스트 불가. (램확인도중 재붓되고 이후 정상포스트후 AMB FAILURE ON BRANCH1 DIMM2(간혹3)이 발생)이때 rsa(관리모듈)로그를 보면 Uncorrectable bus error가 떠있고 다음에러가 BR0 ch0 dimm2(3일경우 3) 에 램에러가 뜹니다. 다만 부팅시에만 이러면괜찮은데 윈도부팅후에도 간헐적으로 프리징이걸리곤 cpu halt가 되어 강제 리셋명령을 때리는경우가 있고 이경우 위와같은 에러로그가 떠 있습니다. 램교차해봤는데 문제가 없는걸 보면 램소켓문제나 시퓨문제 인거같기도하고… 모르겠네요. 혹시 아시는분 있는가요?

짧은글 일수록 신중하게.
발열이 문제로 보입니다.
분해 청소를 한번 해주세요.
     
LUNA 2018-05
발열이라기엔 최초부팅시 포스트 불가도 간혹 터지기도하고.  포스트시 발생하고 한동안 잘되다가 간헐적으로 터지기도 하니… 발열은 아니리라 봅니다. 내부먼지(시퓨힛싱. 램 외부.램방열판 안쪽은 AMB칩셋은 양호. 팬쪽에 약간의 먼지)는 양호합니다.
제온프로 2018-05
메모리 잘 닦아서 다시 설치 하세요...
지우게로 잘 지우세요.
     
LUNA 2018-05
단자는 WD로 닦고 BW-100으로 세척해서 (단자만. 메인보드쪽 소켓 포함)깨끗하리라봅니다. 외관상 녹이나 때는없습니다.
김황중 2018-05
메모리 교체와 cpu 교체를 동시에 진행해보시고
이후에도 발생되면 메인보드 교체하시면 되며
전량 교체후 이상 없다면
Cpu와 메모리중 불량 파트만 찾아서 교체하심 됩니다

이 경우 저라면
일단 새 샤시에 데이타 마이그레이션
이후 기존 서버 폐기 진행할듯 합니다

물론 개인용이 아닌 업무용이라는 전제조건 입니다
     
LUNA 2018-05
제가 개인으로 사용중이고 시퓨는 정상품 확인한걸 가져왔고 x3650자가 테스트(확장테스트)시에도 문제는 없었습니다. 또한 램도 테스트도중에 에러나서 멈추거나 재붓되기도한데 되는경우도있고… 해당램모듈 여분으로 교체후에도 반복되어  다른서버(hp dl140g3)에 꽂아보니 정상작동합니다. 메인보드 불량 의심되네요. 감사합니다.

P.s.light path dignostics(이하 LPD)에 오류 표시 안되고 보드에도 램모듈 표기가 안되는걸보면 보드가 의심이됩니다만 그거외에 다른문제(RAID DASD(디스크어레이)PS1 PS2(리던던트파워)fan 등)은 전부 표시가되는걸 보면 LPD문제는 아니고… 보드의 버스문제로 의심됩니다만 전혀 모르겠어요. ㅠㅠ)

 개인이고 새로운 서버를 사기엔 금전적으로 무리네요. 아직 학생이다보니. ㅠㅠ
     
LUNA 2018-05
에러가 뜬 램이 어느모듈인지 알려줘야 확실히하는데 그걸 모르니 잘못된모듈을 교체햇을 가능성도 있으리라봅니다… BRANCH 1 CH2(혹은3)로 뜨니…
hdd  불량....
     
LUNA 2018-05
HDD불량이라면 레이드에서 오류를 내겠지요. 블스와함께…  그리고 레이드1이라 하드들이 동시에 불량나지않는한 프리징은 없으리라봅니다. 다만 프리징시 RSA II 로그상에 Uncorrectable bus error이 뜨는게 걸리네요
LUNA 2018-05
P.s. os는 서버용이아닌 윈10 pro이고 위증상시 블스는 없고 프리징 발생후 수초-수분후에 재붓됩니다. 원격이고 직접조작이고 안됩니다.
박문형 2018-05
펌웨어 바이오스등 다 최신으로 업 한 것인가요??
     
LUNA 2018-05
네. 펌웨어 바이오스 및 RSA펌웨어. 레이드펌웨어. Bmc펌웨어 전부 최신으로했습니다. (대부분 11년6월 근방) 전부 IBM사이트에서 다운해서 진행했었습니다.BMC업댓중에도 멈춘적이있어서 복구모드에서 강제 업댓 한번 했었습니다. Bmc펌웨어 업글 실패후에 식겁한거 생각나네요. Bmc날아가니 전면패널이 전부 먹통돠고 팬도 풀속이고…
박문형 2018-05
BMC가 보드 매니지먼트 콘트롤러의 약자니 펜 콘트롤 /열관리 등 다 거기서 하죠...

혹시 그러면 HPL 2.1 (하이퍼포먼스린팩) 등을 사용해서 씨피유나 메모리에 부하를 100% 주어서 장시간 돌려 보셨나요??

서버 안정성을 볼 때 HPL을 하루 이상 일주일 가까이 돌리면서 에러 떨어지나 뻗나 보거든요..

하루나 이틀 정도 연속으로 돌려서 이상이 없으면 그 서버는 메모리/씨피유에 문제 없다는 소리가 됩니다..
     
LUNA 2018-05
린팩까진 아니고 자체 부하기능(진단모드)로 풀부하로(디스크포함) 6시간정도 돌려봤습니다. 에러띄우는건 한시간내로 무작위로 떠서…근데 위경우는 오류없이 넘어가더군요. 전혀 원인을 못찾것어요…ㅠㅠ
박문형 2018-05
https://www.passmark.com/products/bit.htm

이런 풀부하 주는 프로그램(유료)도 있긴 합니다..

쪽지로 대용량 화일 받을수 있는 메일 주소 주시면

HPL 2.0이 돌아가는 ISO 이미지를 드릴수 있습니다..

옛날 옛적 TYAN 에서 내부 테스트 용으로 만들었고 씨디에 꾸워서 부팅시키고 이상없이 부팅되면 실행화일 실행하면

HPL 2.0 이 돌아갑니다..
     
LUNA 2018-05
감사합니다. UFD를 이용한 가상 시디영역(윈도 xp 98등 구형 윋도설치가능)으로 부팅이 가능하다면 한번 해보고싶네요. 쪽지드리겠습니다.


QnA
제목Page 1933/5725
2014-05   5245321   정은준1
2015-12   1770686   백메가
2017-07   4410   슬루프
2023-06   4410   일국
2015-12   4410   정든친구
2020-04   4410   진신두
2020-04   4410   엠플
2015-03   4411   두리안
2015-10   4411   janiferr
2014-07   4411   김형준1
2006-10   4411   노하석
2014-02   4411   김민철GC
2015-01   4411   제병수
2018-10   4411   아나키즘
2016-04   4411   김건우
2021-01   4411   구차니
2018-02   4411   박성만
2017-12   4411   김건우
2016-10   4411   하셀호프
2019-10   4411   차평석
2016-04   4411   siteop
2015-05   4411   걸인신홍철