ECC 메모리 정상/비정상 테스트는 어떻게 해야 할까요?

꼬소   
   조회 944   추천 0    

서버가 노후화 되다보니 여기저기 문제가 계속되고 있습니다. 

그래도 부팅을 위해 iLO에서 문제라고 인식되던 메모리를 빼고 정상 동작은 확인했는데,

빼 놓고 보니 이게 메모리 문제인지 슬롯 문제인지 궁금증이 생기기 시작했습니다.

혹시 회원님들만의 ECC 메모리 정상/비정상 테스트 방법이 있거나 구별 방법이 있다면 공유 부탁드립니다. 

감사합니다.

sudo rm -rf /
짧은글 일수록 신중하게.
술이 2024-11
MEMtest 다운받아서 그걸로 돌리면 불량체크 됩니다.

펌웨어 최신거 아니면 메모리 불량도 아닌데 메모리 불량이라고 오류뿜고 비정상 셧다운 되는게 HP서버입니다. 1-2년동안 멀쩡하다가 그 시기가 지나면 본격적으로 문제를 일으킵니다.
     
꼬소 2024-11
답변 감사합니다.
MEMtest으로 확인해 보겠습니다.

안그래도 DL3670 Gen8 서버라 연식은 오래 되어, 고쳐서 쓸지 다른 장비를 들일지 고민을 해 봐야 할 듯합니다.
감사합니다.
박문형 2024-11
우선 정상 동작하는 메모리 잘 인식하는 다른 시스템을 준비합니다..

여러개의 메모리 모듈이 있으면 청소를 하고 우선 한개만 꼽습니다..

https://www.memtest86.com/

memtest86 프로그램을 다운로드 받고 USB 에 설치한 후 시스템에 꼽고 돌립니다..

현재 최신 버젼은 UEFI 모드로만 동작합니다.. UEFI 버젼은 CPU CORE 1개만 사용하더군요..

최신버젼은 대략 4번을 디폴트로 테스트 합니다..

그렇게 해서 에러메세지가 안나오는 메모리 모듈만 모아둡니다..

1차적으로 그렇게 여러개의 메모리 테스트가 끝나면 2차적으로 시스템에 한꺼번에 메모리 모듈을 꼽고 용량 다나오는지 바이오스에서 확인한 후

다시 memtest86 프로그램을 돌려봅니다..

 https://www.2cpu.co.kr/lec/4837

링크의 프로그램은 상용 프로그램인 Pro 버젼입니다.. 테스트 방법은 같지만 나중에 레포트 할 때 편합니다..

아마 이 프로그램은 stop 명령을 주지 않는한 계속 메모리 테스트만 반복하는데 메모리 안정도를 보려면 하루이상 몇일 돌려 봐도 됩니다..

그 외 자세한 사용 방법은 memtest86 사용법이라고 구글링 하면 잘 나올겁니다..


메모리 테스트는 메모리 용량에 따라 틀리지만 은근히 시간이 많이 걸립니다..

최소 반나절 이상은 각오하셔야 합니다..




저 프로그램 외에 메모리 및 CPU에 부하 100%를 주고 계속 돌릴 수 있는 High-Performance Linpack 이란 프로그램이 있습니다..

https://www.netlib.org/benchmark/hpl/

요건 리눅스 전용이라 리눅스 깔고 프로그램 설치 및 컴파일을 해야 돌아갑니다..
     
꼬소 2024-11
자세한 답변 감사합니다.
어떻게 보면 개인적으로 사용하는 서버이고, 서버가 IDC 내부에 있다보니 절차대로 진행은 아주 어려울 것 같습니다.
반출입 절차도 있고.. 적당히 쓰다 폐기하는 것이 오히려 시간과 정신건강을 지킬 수 있을 듯합니다.
DDR3 메모리 가격이 높진 않지만 장터를 둘러봐도 매물이 잘 없네요. 어떻게 보면 구형 서버의 숙명이지 않을까 싶습니다.
감사합니다.
박문형 2024-11
https://www.2cpu.co.kr/sell/619221

검색하기 나름입니다만 여기 장터 뒤지면 웬만한 것은 나옵니다..

사실 DDR3 시스템이면 거진 10여년 넘었을 것이기에 신형 서버로 가는 것도 맞습니다..

어떤 프로그램을 돌리는지는 모르겠습니다만 신형 서버로 가면 OS부터 모든 것을 다 새로 신형으로 맞추어야 하고 개발된 프로그램은 다시 개발시켜야 합니다..

(신형 서버에서는 상황에 따라 옛날 OS가 안돌아갑니다..)

시간 들여서 잘 판단해보시기 바랍니다..
     
꼬소 2024-11
댓글 감사합니다.
지금 서버에 설치된 메모리는 713756-081 인데 소량만 판매하고 있고,
오래된 서버이다 보니 다음 세대로 넘어 가는게 맞지 않나 싶기도 해서 고민이 됩니다.
주로 가상화 관련 테스트용 VM을 만들어 쓰기 때문에 메모리 용량이 민감한데... 언제 고장날지 모르니 대응하기가 참 애매합니다. ㅎㅎㅎ;;
박문형 2024-11
딱 맞는 전용 파츠만 따로 구입하는 것은 쉽지 않습니다..

아마 HP 딱지 붙은 HP 파츠라면 같은 메모리 타입의 다른 모델의 파츠라도 인식과 동작에는 큰 문제 없는 것으로 생각합니다..
제온프로 2024-11
메모리의 소켓 자리를 교체 해 보면..

이게 메모리 문제 인지 소켓 불량인지 알 수가 있습니다.


QnA
제목Page 51/5724
2015-12   1761906   백메가
2014-05   5235692   정은준1
2024-11   945   꼬소
2024-11   1271   헥사코어
2024-11   968   무쏘뿔처럼
2024-11   1076   무쏘뿔처럼
2024-11   705   소음기
2024-11   1264   김준유
2024-11   1084   전일장
2024-11   741   개발네발
2024-11   842   허밍버드
2024-11   1713   리나
2024-11   1022   신은왜
2024-11   896   신은왜
2024-11   841   블루영상
2024-11   1046   L2스위치
2024-11   679   Pippbp컴린이
2024-11   867   뉴비엔지니어
2024-11   786   박문형
2024-11   787   박현문
2024-11   983   홀릭0o0
2024-11   1100   화란