Dell T7610 메모리 문제 - 해결

꿈사   
   조회 2549   추천 0    

일전에 2cpu 에서 Dell T7610 서버를 사서 잘 쓰고 있습니다. ( RAM 16G (4G*4) )

이번에 메모리를 128G (16G*8) 새로 사서 끼웠는데 (기존 메모리는 모두 제거하고) 문제가 있네요. 아래와 같은 Windows event log 가 남습니다. 수천게... 

Event 47, WHEA-Logger
A correct hardware error has occured.
component: Memory
Error Source: Corrected Machine Check

BW-100 사서 접점 청소도 해봤는데, 유의미한 변화는 없습니다. 

현재는 각 cpu별 DIMM1~4(모두 흰색슬롯)에 (위 이미지에서 64G 구성처럼...) 꽂혀져 있습니다.

그래서 궁금한게, 위에 첨부한 Memory Configuration 테이블에 16G * 8개 구성이 없는데, 이게 문제가 되는걸까요?
그게 문제가 된다면, 16G *16개 구성을 하면 될까요?
아니면 메모리가 문제가 있는 걸까요? 그럼 반품이 될까요?

미리 답변 감사합니다. ^^


======================================================

문제가 해결되었습니다. ^^
아래 사진처럼, 슬롯 DIMM1, 2 을 사용하지 않고, 다른 슬롯을 사용하니까 정상 작동을 합니다. ~
현재 슬롯 DIMM3, 4, 7, 8 에 꽂혀진 모습니다.









짧은글 일수록 신중하게.
박문형 2023-03
DDR3 Reg ECC 메모리 같습니다만

8개의 모든 메모리가 같은 모델 같은 타입 같은 주차 인가요??

메모리 테스트가 필요해 보입니다..

메모리 테스트 프로그램인 memtest86 프로그램을 돌려서 실제 불량인지 아닌지 각각 모듈별로 테스트 해서 파악해야 합니다..

(테스트 하는데 시간이 많이 걸립니다..)

개인적으로 보기에는 16GB 8개 구성은 문제가 없다 라고 생각합니다..

메모리 테스트 후 모든 메모리 모듈이 정상 동작한다고 판정이 나면 그다음은 시스템 메모리 슬롯들을 테스트 해보아야 합니다.. 


구매하신 메모리의 교환 / 반품 /환불에 대해서는 구매하신 분과 확인해야 할 문제입니다..
꿈사 2023-03
답변 감사합니다. ^^
네 모두 같은 모델 같은 타입입니다. 메모리 테스트를 했었는데 시간이 너무 걸려서 일단, 멈췄습니다. error 는 없다고 나옵니다.
기존 메모리로 (4G x 4) 갈아 끼우면 다시 정상입니다. ㅜㅜ
박문형 2023-03
메모리 테스트는 처음부터 끝까지 테스트 해야 하고 상황에 따라서는 여러 번 테스트 합니다.. (몇박 몇일 계속 돌림)

메모리 테스트를 100 % 다 하지 않고 중간에 멈추면 그 메모리는 정상인지 아닌지는 모르는 상태로 봐야 합니다..


그 외에는 신뢰도는 메모리 테스트 하는 것보다는 떨어지지만

우선 메모리 모듈 4개를 각 CPU 당 2개씩 꼽고 사용을 해봅니다..

1일 이상 몇일 사용해도 시스템에서 에러메세지가 뜨지 않는다면  각  CPU에 메모리 1개씩 추가 해서 총 6개로 돌려 봅니다..

그런 식으로 계속 메모리 꼽아가면서 사용했을때 에러가 나온다면 그 때 꼽은 메모리와 메모리 슬롯의 불량을 의심하고

따로 분리해서 테스트 해봅니다..
     
꿈사 2023-03
앗 그렇구요. 10시간 돌리다 포기를 했는데... 다시 한 번 해봐야 겠습니다. ^^
꿈사 2023-03
문제가 해결되었습니다. ^^ 감사합니다.
슬롯 DIMM1, 2 을 사용하지 않고, 다른 슬롯을 사용하니까 정상 작동을 합니다. ~ 추가로 올린 사진은 슬롯 DIMM3, 4, 7, 8 에 꽂혀진 모습니다.
     
죠슈아 2023-03
해결된 것이 아닙니다.

기존 구성인 RAM 16G (4G*4)  1 , 2 +  1 , 2  에 4G 4개 일때 정상이면 슬롯 DIMM1, 2 에 문제가 없다는 뜻인데요.
3, 4, 7, 8 에 삽입하면 동작이 한다니 다행 이지만 메모리 채널 C-1, C-2, C-3, C-4 중에  C-3, C-4 만 사용 하므로 메모리 대역폭이 1/2 으로 줄어 듭니다.

CPU 장착을 다시 해보세요.  메모리는 시피유와 직결 이므로  CPU 장착 상태가 나쁘면 발생할 수 있는 증상 입니다.
CPU 핀 패드가 깨끗한지 ...  CPU 소켓 핀이 휘거나 정열 상태가 고른지 .. 확인해 보세요,
히트싱크는 고정나사를 최대한으로 조이지 말고  마지막에 1/2 회전 정도를 풀어 주세요.
          
꿈사 2023-03
네 맞습니다. 정상 상태는 아닙니다. 쿼드채널을 못쓰는 상황입니다. 다행인건 메모리는 문제가 없다는 것입니다. ^^
기판을 보고 제가 복기를 해보니 지금까지 4G 4개가 DIMM1, 2가 3, 4에 꽂혀 있었더라구요.
그래서 추정하는 것은 DIMM1, 2 쪽에 문제가 좀 있나 그랬습니다.

cpu 장착을 다시 깔끔하게 해보겠습니다. 히트싱크도 너무 강하게 조인 것 같기도 하니 말입니다.
답변 감사합니다. ^^
               
죠슈아 2023-03
기판을 보고 제가 복기를 해보니 지금까지 4G 4개가 DIMM1, 2가 3, 4에 꽂혀 있었더라구요

==>
4G 4개가 CPU 0과 CPU 1 각각 DIMM3,4에 설치된 것이라는 것이죠...
그러면 DIMM1,2 위치인 Channel-1, Channel-2가 문제라는 뜻인데요.

CPU 0과 CPU 1 의 Channel-1, Channel-2가 동시에 문제일 가능성이 낮으므로

1) CPU 0 에 DIMM1,2 , CPU1 과  SRAM  제거 상태로 부팅...
2) CPU 0 에 DIMM3,4 , CPU 1 에 DIMM1,2  각각 SRAM  장착후 부팅
3) CPU 0 에 DIMM3,4 , CPU 1 에 DIMM3,4  각각 SRAM  장착후 부팅  -- 이미 부팅 되는 것을 확인한 상태 ...

1) 과  2) 를 테스트 하면 CPU 0 의 DIMM1,2 ( CH0,CH1 ) 에만 문제 인지 , CPU 0 과 CPU 1 의 DIMM1,2 ( CH0,CH1 ) 모두에 문제인지 ...
후자일 가능성은 낮지만 ... 
만일 CPU 0 의 DIMM1,2 만의 문제이면  CPU 0 과 CPU 1 을 swap 해서 1) 과  2) 를 테스트 하면
CPU 0 과 CPU 1의 칩의 문제 여부 확인 가능하구요.
2) 의 경우에 CPU 0 과 CPU 1 을 swap 해서 부팅 불가 문제가 발생하면 해당 소켓의 문제 입니다.

이 과정을 해보시면서 CPU0,1 칩의 패드상태와 소켓 핀의 상태도 확인하시고
히트싱크 장착시 텐스를 조절하시다가 ...
운이 좋으면 더 이상 메모리 슬롯 때문에 발생하는 오류 없이 정상 상태가 될 수도 있고 ...
CPU 0,1  의 physical defect  또는 CPU 0,1 sokect defect를 발견 한다면 ...
defect CPU를 교체 하시거나 defect pin (bent pin only) 를 교정하시거나 ...  이건 아주 주의해서 아주 약하게 살살해야 합니다 ....

defect CPU를 발견 하신다면 두번째로 운이 약간의 비용이 들지만 좋으신것이고
defect pin (bent pin only) 를 비용은 들지 않지만 교정이 까다로울 수 있기 때문에 세번째로 운이 좋으신것이고
1), 2) 테스트 과정에서 아무런 defect 발견 없이 메모리 이슈가 계속 되면 최악의 경우가 됩니다.....  포기하시던지 보드만 교체하시던지 ..
제가 사용하지 않는 Dell T7610 보드가 있어서 보내드리고 싶지만 ...  배송 비용이 구입 비용과 거의 같을 것 같아서 ....
원하신다면 보내 드리지요.... 

이베이 에서 구입 가격이 $48.90  ~ $60 정도 인데 ..  한국까지 배송비가 $75 ..  배보다 뭐가 ㅎㅎㅎ
한국까지 배송 비용이 얼마나 될지는 알아봐야겠지만  ..
최소 $20 ~$30 은 될 듯 합니다.


QnA
제목Page 363/5724
2015-12   1761696   백메가
2014-05   5235420   정은준1
2023-03   2850   허밍버드
2023-03   1986   미담
2023-03   1767   LevinF
2023-03   2043   galaxyfamily
2023-03   1816   이희주
2023-03   2393   inquisitive
2023-03   2252   yummy
2023-03   5211   만곰이
2023-03   2514   yummy
2023-03   2335   yummy
2023-03   3500   션한맥주
2023-03   2474   강한구
2023-03   5491   키르히호프
2023-03   2349   긴머리루이스
2023-03   3316   까치산개꿀탱
2023-03   2267   홀릭0o0
2023-03   4641   린드버그
2023-03   3755   트렌드
2023-03   2980   wguardian
2023-03   2372   경박한시민