160;안녕Ȣ16;1;니까
메모리 Correctable ECC 에러/196; 1064;한 리눅스 시스템 멈춤 현상1004;/196; 1656;문 드립니다.
오늘 아침에 1068;Ǻ12;나 리눅스가 설치.108;(Debian, Kernel 5.4 버1260;) 1228; 서버가 멈추Ǻ12; 1080;lj16;,163;1012; 확1064;Ȣ16;였습니다.
Ȗ12;보드 Numlock Ȗ12;에 불1060; 들Ǻ12;오1648; 않lj16; መ1; 0152;1025;1012; Ȣ16;1648; 않lj16; 상태라 1204;원 버튼1012; 눌러 시스템1012; 리셋 Ȣ16;였습니다.
ǥ12;ᔚ1; 뒤 리눅스 syslog를 확1064;해보니 특1221; 시각 1060;후/196; 시스템1060; 멈추었다lj16;,163;1012; 알 수 1080;었고,
IPMI Event Log를 보고나서, syslog가 -130;긴 시각과1032; Time Stamp 대1312;를 통Ȣ16;여160;
Correctable ECC 에러가 0156;생한 후 시스템1060; 멈추었다lj16;,163;1012; 알 수 1080;었습니다.
시스템1060; 멈추,172; .108; 원1064;1008; syslog에 남아1080;1648; 않아, Correctable ECC 에러 0156;생 뒤 커널에 문1228;가 생긴Ǐ19; 합니다.
1060;후/196; 아침에 한 번 더 같1008;1068;1060; 1068;Ǻ12;나(Correctable ECC 에러 0156;생 뒤 시스템 멈춤)
Correctable ECC 에러가 0156;생한 후에 시스템1060; 멈춘다lj16;,163;1012; 확실7176; 확1064;Ȣ16;였습니다.
1228; 1656;문들1008; 다1020;과 같습니다.
1) 1228;가 알기/196;lj16;, "Correctable" ECC 오류가 0156;생Ȣ16;면, Ȣ16;드웨Ǻ12;가 커널에 그 사실1012; 통보Ȣ16;고,
오류 0156;생 횟수가 많1060; 누1201;.104;1648; 않lj16; 1060;상 시스템1008; 계속 ᇼ1;1089;Ȣ16;lj16;,163;1004;/196; 알고 1080;습니다.
그러나 -130;Ǻ12;1652; syslog, 0152;1025;Ȣ16;1648; 않lj16; 시스템 መ1;1004;/196; 보았1012; ǐ12;, Correctable ECC 오류 0156;생 후 리눅스 커널1060;
hang 상태가 .108; ,163; 같습니다. 1060;유가 Ƽ17;금합니다.
2) 다른 모든 ǥ12;품들1008; 그대/196;1060;1648;만, 1228;가 최근에 메1064;보드를 교체Ȣ16;였습니다.
1060;1204;에lj16; ECC에러를 겪Ǻ12;본 1201;1060; 없Ǻ12; 드lj16; 생각1064;데
"Correctable ECC 오류" 1060;벤트가 메1064;보드 결함1004;/196;도 0156;생할 수 1080;나요?
아니면 "Correctable ECC 오류" 1060;벤트 /196;그/196;ǥ12;터, 특1221; 슬ǘ15;1032; 메모리(CPU1 DIMMA1)가 문1228;라lj16;,163;1012; 확신할 수 1080;1012;까요?
오늘 memtest를 돌/140;볼 예1221;1064;데, 문1228;1032; 원1064;1060; .104;lj16; Ȣ16;드웨Ǻ12;를 최대한 1221;확7176; 찾고 dz10;습니다.
감사합니다.
Micron ¸Þ¸ð¸® ¿´´Âµ¥.. µµÀúÈ÷ ´Û¾Æµµ ´Û¾Æµµ ¼öÁ¤ÀÌ ¾ÊµÇ¾î..
±³Ã¼ Çß½À´Ï´Ù...
2. º¸µåÀÏ ¼ö µµ ÀÖ°í, ·¥ÀÏ ¼ö µµ ÀÖ°í, ½ÃÇ»ÀÏ ¼ö µµ ÀÖ½À´Ï´Ù (½ÃÇ»-º¸µå-·¥ ÀÌ·¸°Ô Á÷°áµÇ´Ï±î¿ä)
µÎ ¹ø ´Ù moving inversions test Áß Gen_Prot CPU ÀÎÅÍ·´Æ®·Î ÁßÁöµÇ³×¿ä...
ÇÑ ¹øÀº 38G - 40G ¹üÀ§¿¡¼, ±× ´ÙÀ½Àº 46G - 48G ¹üÀ§¿¡¼ ¶ß´Â±º¿ä.
IPMI¿¡´Â ¾Æ¹«°Íµµ ±â·ÏµÇÁö ¾Ê³×¿ä
¹®Á¦°¡ Áö¼ÓµÉ ¶§ CPU û¼Ò+±³Ã¼, ¸Þ¸ð¸® û¼Ò+±³Ã¼·Î´Â ¹®Á¦°¡ »ç¶óÁöÁö ¾Ê¾Ò´Âµ¥ °á±¹ º¸µåÀÇ ½½·ÔÀÌ ¹®Á¦¿´´ø °Í °°³×¿ä.
°æÇè´ãÀ̾ú½À´Ï´Ù.
¿Ö ±×·±Áö ¾Ë°í ½ÍÀ¸¸é Á¦Á¶»ç¿¡ ºÐ¼® ÀÇ·ÚÇØ º¸¼¼¿ä..
ºÐ¼® ºñ¿ëÀÌ µû·Î û±¸µÉ ¼ö ÀÖ°í ¿øÇÏ´Â ´äÀÌ ¾È ³ª¿Ã¼öµµ ÀÖ½À´Ï´Ù..
±×¸®°í ã¾Æ³»±âµµ Èûµé°í Àß ¾ø´Â °ÍÀÌÁö¸¸ IPMI Æß¿þ¾î ¹ö±×ÀÏ ¼öµµ ÀÖ½À´Ï´Ù..