메모리의 UECC: CRITICAL 에러 메시지

잡식   
   조회 4888   추천 0    

안녕하세요,


슈퍼마이크로 타워 서버 사용 중인 대학원 연구실입니다.


슈퍼닥터로 가끔 모니터링 중인데요, 아래와 같은 메모리 에러가 떴습니다.

(이것 때문인지는 모르겠지만, 3시간쯤 전에 자동으로 재부팅이 된 것도 같습니다.)


검색해 보니 재부팅해서 MEMtest 를 하라는 것 같은데요, 재부팅하기도 겁이 좀 나네요 ㅜㅜ.


현재 서버는 정상적으로 돌아가는 느낌이구요, 램 용량도 원래대로 다 인식되는 것 같습니다. (64 GB x 8 개)


혹시 가능한 원인이나 해결 방법이 있으시면 조언 부탁립니다.


감사합니다.

 


 

짧은글 일수록 신중하게.
박문형 2022-02
구글링해보았습니다..

======================================================================

- CECC error , UECC error
메모리 CECC error(Correctable Error-Correcting)

말그대로 Correctable한 ECC error로 노드 재부팅시 Repair 가능(BIOS 42.300버전부터 기능 제공)
RAS 기능 – CECC 한정 메모리 장애로 인하여 노드가 재부팅되는 것을 막는 기능
재부팅시 repair 되지않았을 경우에는 바로 RMA 처리가 가능하여 메모리 교체 진행
메모리 UECC error(Uncorrectable Error-Correcting)

UECC는 발생하면 언제 노드가 재부팅될지 모르며, Uncoortable한 error이기 때문에 바로 RMA를 진행하고 교체하라고 합니다.
문제는 CECC발생시 방치해둘 경우 UECC로 바뀐다는 점인데

UECC로 바뀔 시 노드가 언제 재부팅될지 모르기 떄문에 위험하여 해당 알람이 발생되면 최대한 빨리 작업하는 것을 권장합니다.

===================================================================


메모리 불량이니 메모리 구해서 교환하세요..

무상 AS기간이 남아 있다면 구매한 곳에 문의해서 조치 받으세요..
     
잡식 2022-02
헐, 상황이 좋지 않네요 ㅠㅠ

업체에 연락해서 유상으로라도 AS를 받아야겠습니다.

밤 늦은 시간에 답변 감사드립니다.


QnA
제목Page 605/5728
2015-12   1780656   백메가
2014-05   5255746   정은준1
2016-02   4498   edguy
2019-04   3661   행복하세
2010-03   7977   Hydra
2018-03   6021   송주환
2019-05   3605   정의석
2010-04   8875   백승철
2019-05   3773   잊혀진자
2018-03   3682   lovin09
2019-05   3164   두부깜바
2013-05   6697   김동식
2017-01   4334   두cpu
2019-05   2730   김건우
2020-07   6171   물산후니
2020-08   4334   DDDIE
2016-02   5580   베커
2022-01   2063   민사장
2016-02   4189   하늘하늘
2022-01   6041   블루영상
2017-01   3851   H4CHI
2020-08   2212   henol