메모리의 UECC: CRITICAL 에러 메시지

잡식   
   조회 3722   추천 0    

안녕하세요,


슈퍼마이크로 타워 서버 사용 중인 대학원 연구실입니다.


슈퍼닥터로 가끔 모니터링 중인데요, 아래와 같은 메모리 에러가 떴습니다.

(이것 때문인지는 모르겠지만, 3시간쯤 전에 자동으로 재부팅이 된 것도 같습니다.)


검색해 보니 재부팅해서 MEMtest 를 하라는 것 같은데요, 재부팅하기도 겁이 좀 나네요 ㅜㅜ.


현재 서버는 정상적으로 돌아가는 느낌이구요, 램 용량도 원래대로 다 인식되는 것 같습니다. (64 GB x 8 개)


혹시 가능한 원인이나 해결 방법이 있으시면 조언 부탁립니다.


감사합니다.

 


 

짧은글 일수록 신중하게.
박문형 2022-02
구글링해보았습니다..

======================================================================

- CECC error , UECC error
메모리 CECC error(Correctable Error-Correcting)

말그대로 Correctable한 ECC error로 노드 재부팅시 Repair 가능(BIOS 42.300버전부터 기능 제공)
RAS 기능 – CECC 한정 메모리 장애로 인하여 노드가 재부팅되는 것을 막는 기능
재부팅시 repair 되지않았을 경우에는 바로 RMA 처리가 가능하여 메모리 교체 진행
메모리 UECC error(Uncorrectable Error-Correcting)

UECC는 발생하면 언제 노드가 재부팅될지 모르며, Uncoortable한 error이기 때문에 바로 RMA를 진행하고 교체하라고 합니다.
문제는 CECC발생시 방치해둘 경우 UECC로 바뀐다는 점인데

UECC로 바뀔 시 노드가 언제 재부팅될지 모르기 떄문에 위험하여 해당 알람이 발생되면 최대한 빨리 작업하는 것을 권장합니다.

===================================================================


메모리 불량이니 메모리 구해서 교환하세요..

무상 AS기간이 남아 있다면 구매한 곳에 문의해서 조치 받으세요..
     
잡식 2022-02
헐, 상황이 좋지 않네요 ㅠㅠ

업체에 연락해서 유상으로라도 AS를 받아야겠습니다.

밤 늦은 시간에 답변 감사드립니다.


QnA
제목Page 1184/5710
2015-12   1693553   백메가
2014-05   5159292   정은준1
2017-04   3498   박문형
2017-06   3498   송주환
2018-03   3498   신은왜
2018-08   3498   큰곰하우스
2015-03   3498   차평석
2015-07   3498   오성기
2021-02   3498   심바트
2019-03   3498   정연
2023-12   3498   찐짜헌이
2016-03   3498   천외천oo노…
2019-03   3498   땅땅
2019-01   3498   epage
2015-06   3498   무아
2019-05   3499   경이아빠
2014-04   3499   여주이상돈
2014-03   3499   빠시온
2017-03   3499   질문학생
2015-08   3499   윈도우10
2020-08   3499   권용1
2020-02   3499   병맛폰