dell ¼­¹ö memory ÇÏÀÚ À¯¹« ÀçÆǺ° ¹®ÀÇ

mjk0401   
   Á¶È¸ 2393   Ãßõ 0    

안녕하세요 대기업 k@에 dell서버를 납품하고 있습니다.


 발단은... dell 서버 r740 r640 을 이곳에 납풉하고있습니다.


case. 만약 납품한 서버에서 memory 장애가 난경우 


                                                      Q1.) 해당 장비 isuue 가   Multi-bit error 인가?

 

                                                                   yes↙               ↘no

 

                                          A) dell고객센터를 통해 접수                 Q2.) 해당 장비 isuue 가 Correctable error 인가?

                                                (TSRlog 첨부)

                                      case1↙               ↘case2                                                         ↘yes


                   Dell에서 특이사항 없이             Dell에서 Bios버전을 업그레이드 권장                        A) dell고객센터를 통해 접수 (TSRlog첨부)

                   memory교체 해준다                및 isuue memory 탈부착 시도 권장


                    case3↙                                            ↘case4                                                         ↘case2  

      또 같은위치에 memory isuue가                              권장방법을 다 시도후에도 동일한                    Dell에서 Bios버전을 업그레이드 권장   

     생겼다면 메인보드 교체 권장                                  memory isuue가 또 발생했다면                     및 isuue memory 탈부착 시도 권장        

                                                                       Dell에서 memory 교체 해준다                              case4


                                                                                                          권장방법 다 시도 후에도 동일한 memory 

                                                                                                    isuue가 또 발생했다면 Dell에서 memory 교체 해준다    


위사항 isuue 발생한 경우 대부분 case2, case4 로 흘러갑니다. (dell 입장 기준)

근데 현실은 dell 권장 방법처럼 할수가 없네요.

K@입장에서는 운영중인 서버를 총 2번 리부팅하게 되니깐요 (덤으로 야간작업도 2번!!)

그래서 그런지 사무실 사내 memory로 그냥 울며 겨자먹기로? 교체해주고 있습니다.

서론이 길었는데... 결론은 이런식으로 사내 memory로 손해보면서 계속 교체해주고 있습니다.



장애난 memory( Correctable, Multi-bit)를 사내 사무실에 장착하고 모니터링 해봐도 동일하게

장애가 발생하질 않더군요... 동일하게 장애가 나야 신규 memory로 맞교환이라도 할텐데 ㅠ...

그래서 질문이 이겁니다.


R640 R740

사용OS : Centos6버전 , 7버전

서버 OS상에서 memory 부하를 일으킬수 있는 명령어가 있을까요?(서비스가 돌아가는 환경처럼 구성 필요)

동일하게 memory issue가 떠야 하는데 여태까지 단 한번도 일어난적이 없네요.



ps. Correctable, Multi-bit로 손해보며 쌓인 메모리가 20개 넘네요 ㅋㅋㅋ













알겠습니다.
ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
¼ÛÁÖȯ 2021-11
Ŭ¶ó¿ìµå ¿öÅ©·Îµå¸¦ ¸ð»çÇÒ ¼ö ÀÖ´Â º¥Ä¡¸¶Å©·Î´Â X-MemÀÌ ÀÖ°í (https://github.com/microsoft/X-Mem)
´Ü¼ø ºÎÇÏ ¸ñÀûÀ̸é Intel Memory Latency Checker¸¦ »ç¿ëÇÏ½Ã¸é µË´Ï´Ù. (intel.com/content/www/us/en/developer/articles/tool/intelr-memory-latency-checker.html)
+ ½ºÆ®·¹½º Å×½ºÆ®·Î´Â stress-ng¸¦ »ç¿ëÇϼŵµ µË´Ï´Ù.
epowergate 2021-11
ÀÏ´Ü correctableÀº AS ´ë»óÀÌ ¾Æ´Ò°Ì´Ï´Ù.  ±×³É correct Çß´Ù´Â ¸Þ½ÃÁö ÀÔ´Ï´Ù.
Multi-bitÀº AS ´ë»óÀÔ´Ï´Ù.
º¸Åë DELLÀº TSR ·Î±× ¹ÝÃâÇÏ°í È®ÀÎµÇ¸é ±³Ã¼ ÇØÁִ°ɷΠ¾Ë°í Àִµ¥ °í°´»ç¸¶´Ù ´Ù¸¥°¡ º¾´Ï´Ù.
±×¸®°í Á¦Á¶»ç (DELLµî)¿¡¼­ Memory°¡ ºÒ·®ÀÌ ¹ß»ýÇß´Ù°í Çؼ­ "Å»ºÎÂø" Çغ¸¶ó°í ÇÏÁö ¾Ê½À´Ï´Ù.  ¸¸¾à ±×·¨´Ù¸é ´ã´ç ¿£Áö´Ï¾î°¡ ¹º°¡ À߸øÇÏ°í ÀÖ´Â °Ì´Ï´Ù.

±×¸®°í k@¶ó¸é Àü´ã ¿£Áö´Ï¾î°¡ ÀÖÁö ¾Ê³ª¿ä?
Ãß°¡ºñ¿ëÀÌ µé±â´Â Support¸¦ ±¸ÀÔÇϽǶ§ Àü´ã¿£Áö´Ï¾î¸¦ Æ÷ÇÔÇÏ´Â »óÇ°À» ±¸¸ÅÇϽøé ÀÌ·± Á¾·ùÀÇ AS´Â ¸ðµÎ Àü´ã ¿£Áö´Ï¾î°¡ ó¸®ÇØ ÁÝ´Ï´Ù.
ÀÌ·Â °ü¸® Æ÷ÇÔÇؼ­¿ä.
¹°·Ð »çÀÌÆ®¸¶´Ù ´Ù¸¦ ¼ö´Â ÀÖ°Ú½À´Ï´Ù
     
mjk0401 2021-11
´ë»ó¼­¹ö: @@#3 MONI

[¹®ÀÇ ³»¿ë]
- DIMM#A4 Multi-bit memory error ¹ß»ý

- ÇöÀç »ç¿ë ÁßÀÎ BIOS Æß¿þ¾î ¹öÀüÀº 1.5.4 ¹öÀüÀ¸·Î ¸¹ÀÌ ³·Àº ¹öÀüÀ» »ç¿ë ÁßÀÎ °ÍÀ¸·Î È®ÀÎÇÏ¿´½À´Ï´Ù.

- BIOS 2.7.X ÀÌ»óÀÇ Æß¿þ¾î ¹öÀü¿¡¼­´ÂMEM0001 À̺¥Æ® ¹ß»ý ½Ã, ¸Þ¸ð¸® ÀçÀåÂø ¹× RebootÀ» ÅëÇÑ Self-healing(ÀÚ°¡ Ä¡·á) ±â´ÉÀÌ Ãß°¡µÇ¾ú½À´Ï´Ù.

- µû¶ó¼­,  Self-healing ±â´ÉÀÌ Ãß°¡µÈ ÃֽŠBIOS Æß¿þ¾î ¹öÀüÀ¸·Î ¾÷µ¥ÀÌÆ®¸¦ ±Ç°íµå¸®¸ç, ÀÌÈÄ ÇØ´ç DIMM#A4 ¸Þ¸ð¸® ÀçÀåÂø ¹× RebootÀ» ÅëÇÑ Self-healing(ÀÚ°¡ Ä¡·á)ÀÌ ¼öÇàµÉ ¼ö ÀÖµµ·Ï ÁøÇàÀ» ±Ç°íµå¸³´Ï´Ù.

- ÇØ´ç ÀÛ¾÷ ÀÌÈÄ Self-healing¿¡ ½ÇÆеǾú´Ù´Â À̺¥Æ®(MEM0805)°¡ ¹ß»ýÇϰųª, µ¿ÀÏ ¸Þ¸ð¸®¿¡¼­ À̽´°¡ Áö¼ÓµÈ´Ù¸é ÇØ´ç ¸Þ¸ð¸® ±³Ã¼°¡ ÇÊ¿äÇÕ´Ï´Ù.

µû¶ó¼­, iDRAC,BIOS Æß¿þ¾î ¹öÀüÀ¸·Î ¾÷µ¥ÀÌÆ® ¹× DIMM#A4 ¸Þ¸ð¸® ÀçÀåÂø ÀÛ¾÷À» ±Ç°í ÇÏ°íÀÖÀ½

´ëÃæ 8ÇÒÀº ÀÌ·±½ÄÀ¸·Î  Dell ±â¼úÁö¿ø ÆÀ¿¡°Ô ¸ÞÀϴ亯ÀÌ ¿É´Ï´Ù. ³­°¨ÇÏÁÒ ¤»¤»¤»
±èȲÁß 2021-11
Àú´Â ÀÌ·±°æ¿ì ¾Øµå´Ü¿¡ À̸® ¾ê±âÇÕ´Ï´Ù

°í°´ÀÌ ¾Æ´ÂüÇϸé Áö³×°¡ ¼­ºñ½ºÇØ¾ßµÉ ºÎºÐÀ» °í°´¿¡°Ô Àü°¡½ÃÅ°´Ï
³ª´Â ¸ð¸£¼â...  ±×³É ¾ÊµÇ¶ó°íÇϸé
ÇØ´ç º¥´õ ¿£Áö´Ï¾î°¡ ¿Í¼­ ó¸®ÇØÁÖ°í °©´Ï´Ù... ¶ó°í...

¼±ÅÃÀº °í°´ ¸òÀÌÁÒ
¹Ú¹®Çü 2021-11
PC³ª Á¶¸³¼­¹ö¿¡¼­´Â memtest86 À̶ó´Â ÇÁ·Î±×·¥ÀÌ ¸Þ¸ð¸® Å×½ºÆ®¿ëÀ¸·Î »ç¿ëµË´Ï´Ù..

https://www.memtest86.com/

±× ¿Ü HPL À̶õ ÇÁ·Î±×·¥µµ »ç¿ëÀÌ °¡´ÉÇÕ´Ï´Ù..

¸®´ª½º¿¡ ÄÄÆÄÀÏÇؼ­ µ¹¸®´Âµ¥ ½ÇÇàµÇ¸é ¸ØÃ߶ó°í ¸í·ÉÀ» ÁÙ¶§±îÁö´Â ¸Þ¸ð¸®¿Í CPU¸¦ °è¼Ó ºÎÇϸ¦ Á־ °¥±Á´Ï´Ù..

https://icl.utk.edu/hpl/index.html


QnA
Á¦¸ñPage 5074/5692
2015-12   1554009   ¹é¸Þ°¡
2014-05   5018670   Á¤ÀºÁØ1
2020-12   2393   °ú¾Ï
2017-03   2393   cbr600f6
2020-10   2393   inquisitive
2019-04   2392   7755
2023-01   2392   pibang
2019-04   2392   ±×¸°
2023-03   2392   ȸ¿ø
2021-09   2392   galaxyfamily
2020-08   2392   ÀüÁø
2021-09   2392   ÇູÇϼ¼
2020-03   2392   epowergate
2022-03   2392   ¿ÕÃʺ¸¿Õ
2021-01   2392   ¹ü¹üÀÌ
2020-09   2392   GPGPU
2022-01   2392   ¿ì´çÅÁÅÁ
2019-12   2392   ±¼´Ù¸®±³
2020-07   2392   GPGPU
2023-10   2392   chotws
2019-12   2391   ¾çâ±Ç
2021-07   2391   ±îÄ¡»ê°³²ÜÅÊ