메모리의 UECC: CRITICAL 에러 메시지

잡식   
   조회 3716   추천 0    

안녕하세요,


슈퍼마이크로 타워 서버 사용 중인 대학원 연구실입니다.


슈퍼닥터로 가끔 모니터링 중인데요, 아래와 같은 메모리 에러가 떴습니다.

(이것 때문인지는 모르겠지만, 3시간쯤 전에 자동으로 재부팅이 된 것도 같습니다.)


검색해 보니 재부팅해서 MEMtest 를 하라는 것 같은데요, 재부팅하기도 겁이 좀 나네요 ㅜㅜ.


현재 서버는 정상적으로 돌아가는 느낌이구요, 램 용량도 원래대로 다 인식되는 것 같습니다. (64 GB x 8 개)


혹시 가능한 원인이나 해결 방법이 있으시면 조언 부탁립니다.


감사합니다.

 


 

짧은글 일수록 신중하게.
박문형 2022-02
구글링해보았습니다..

======================================================================

- CECC error , UECC error
메모리 CECC error(Correctable Error-Correcting)

말그대로 Correctable한 ECC error로 노드 재부팅시 Repair 가능(BIOS 42.300버전부터 기능 제공)
RAS 기능 – CECC 한정 메모리 장애로 인하여 노드가 재부팅되는 것을 막는 기능
재부팅시 repair 되지않았을 경우에는 바로 RMA 처리가 가능하여 메모리 교체 진행
메모리 UECC error(Uncorrectable Error-Correcting)

UECC는 발생하면 언제 노드가 재부팅될지 모르며, Uncoortable한 error이기 때문에 바로 RMA를 진행하고 교체하라고 합니다.
문제는 CECC발생시 방치해둘 경우 UECC로 바뀐다는 점인데

UECC로 바뀔 시 노드가 언제 재부팅될지 모르기 떄문에 위험하여 해당 알람이 발생되면 최대한 빨리 작업하는 것을 권장합니다.

===================================================================


메모리 불량이니 메모리 구해서 교환하세요..

무상 AS기간이 남아 있다면 구매한 곳에 문의해서 조치 받으세요..
     
잡식 2022-02
헐, 상황이 좋지 않네요 ㅠㅠ

업체에 연락해서 유상으로라도 AS를 받아야겠습니다.

밤 늦은 시간에 답변 감사드립니다.


QnA
제목Page 4514/5710
2014-05   5157831   정은준1
2015-12   1692096   백메가
2014-03   3515   아름다운노을
2017-05   3515   열씨미
2015-02   3515   정용호1
2019-04   3515   두슬아빠
2016-03   3515   지존컴퓨터
2018-08   3515   이지포토
2017-05   3515   코쿠
2020-01   3515   도경
2017-08   3515   캔위드
2017-01   3515   나비z
2016-11   3515   윈도우10
2018-02   3515   메가날백
2014-02   3515   빠른개미
2017-07   3515   장동건2014
2020-04   3515   테츠
2017-09   3515   두cpu
2014-03   3514   걸인신홍철
2017-05   3514   허진형ALpha
2014-08   3514   장동건2014
2020-07   3514   이종현oph