서버 메모리 불량 났을 때 증상

   조회 6071   추천 0    

서버 사용 중 메모리 불량 시 어떤 벤더 서버는 오류메세지 뿌리면서

서버는 죽지않고 사용은 가능하고 어떤 벤더 서버는 메모리 오류시 그냥 다운되는 서버가 있는데 차이점이 뭘까요?

검색을 해봐도 잘 모르겠네요. 기술적 차이 같은데 자료도 구하기 싶지 않고 ㅜㅜ

메모리는 DDR4 Memory Registered ECC 사용하고 있습니다.

짧은글 일수록 신중하게.
박문형 2021-03
실제 일어난 사고라면 서버제조사에 기술 문의 해보는게 다라고 생각됩니다..
제온프로 2021-03
서버운영 관리 기술입니다..

부팅시 메모리 테스트를 하여 문제가 있으면..
Notice를 주고 Offline 시켜줍니다.. 
그리고 서버에 빨간불 들어오죠...

이런 기술이 없는 벤더 서버는 돌다가 오류나서 시스템이 죽어버립니다...

이러면 않되죠...
이런 서버에 어떻게 중요한 임무를 맏기며...
중요한 연산을 시킬수 있겠습니까...

시뮬레이션 이나 연산하다가 메모리 오류로 다운되면 처음서 부터 다시..
재부팅 해서 연산하다가 다운.. 재부팅..
무한 반복하죠...
화란 2021-03
ECC 기능으로...

1 bit 오류를 correction하고 서버가 안죽는 경우가 있고

오류가 1 bit 이상으로 많아서 코렉션 능력치 오바되면 서버가 죽는 경우가 있죠.

https://ko.wikipedia.org/wiki/ECC_%EB%A9%94%EB%AA%A8%EB%A6%AC
박문형 2021-03
술이 2021-03
ECC든 아니든 커널이 메모리에 상주해 있으면 떨어지는건 전부 똑같습니다.
ECC를 하면 서버가 안정적이다가 아니라 메모리 커럽션으로 인한 데이터 정합성 오류를 미연에 방지하고자 사용하기도 하고 ECC라고 데이터 안깨지는거 아닙니다. 이것도 복불복입니다.
요즘은 윈도우도 좋아져서 메모리 조금만 문제 있다 싶으면 그냥 하드웨어 예약으로 사용못하게 해버리면서 서버를 안정적으로 구동하게 해줍니다.
제온프로 2021-03
윈도우 10
윈도우 2016
윈도우 2019

에 보면.. 작업관리자에서 메모리양을 보면..

128GB(112GB사용가능)  이렇게 나올때가 있습니다..
메모리에러가 자꾸 나니까 윈도우가 모듈1개를 운영에서 배제 시킨 경우라고 볼수 있습니다..


QnA
제목Page 2307/5708
2014-05   5143831   정은준1
2015-12   1677973   백메가
2005-12   5751   정영교
2011-11   5751   수퍼맨1
2005-10   5751   전경웅
2005-09   5751   백계현
2005-10   5751   이성준
2006-04   5751   하상필
2006-09   5751   이병관
2007-10   5751   이덕진
2008-03   5751   이문흠
2013-04   5751   김황중
2018-11   5751   TLaJ3KtYGr
2016-08   5751   sensekuh
2006-05   5751   고윤철
2015-12   5751   DOSS
2006-06   5750   박기두
2020-11   5750   붉은허스키
2013-02   5750   Curix김경수
2015-09   5750   깡통이
2019-12   5750   조재형3
2011-11   5750   방o효o문