ECC 기능이 있는 메모리 사용중에 서버가 리부팅 되었습니다. 로그에는 memory uncorrectable error가 남아있었습니다.
memtest 결과 해당 메모리에서 ECC ERROR가 지속적으로 발생했습니다. ECC기능 때문인지 최종 error 개수는 0개로 나왔습니다.
그럼 서버가 리부팅된 이유는 ECC기능으로 수정할 수 있는 single bit error가 아니라 uncorrectable error(multi bit error)가 발생해서였을까요?
테스트에서 나온 ecc error는 ecc기능으로 인해 스스로 수정해서 서버엔 지장이 없었을 거라고 생각되는데 (memtest에서 최종 error 개수가 0으로 나온 것 처럼)
그리고 메모리쪽 error로 인해 서버가 다운 되거나 리부팅 되는 이유도 궁금합니다!
감사합니다.
±×·¡µµ ÀÌ»óÀÌ ¹ß»ýÇÏ¸é º¸µå³ª CPUÂÊ ¹®Á¦ÀÏ ¼ö ÀÖ½À´Ï´Ù..(¿©·¯ °³ÀÇ ¸Þ¸ð¸® ¸ðµâÀÌ ºÒ·®Àϼöµµ ÀÖÀ¸´Ï °ËÅä/äũ ÇغÁ¾ß ÇÕ´Ï´Ù..)
¾î´À Á¦Á¶»ç Á¦Ç°ÀÎÁö ¸ð¸£°ÚÁö¸¸ ÆǸÅÀÚ³ª Á¦Á¶»ç¿¡ °ËÁõÇØ ´Þ¶ó°í Çغ¼ ¼ö´Â Àִµ¥
(¹®Á¦°¡ ÀÖ¾î º¸ÀÌ´Ï Á¤È®È÷ ¾î¶² ¹®Á¦ÀÎÁö °ø½ÄÀûÀ¸·Î ¸®Æ÷Æ® ÇØ´Þ¶ó...)
°ËÁõÀ» Á¦Á¶»ç°¡ ÁøÇà °¡´ÉÇÏ´Ù¸é ½Ã°£µµ ¸¶´Ï °É¸®°í °ËÁõ ºñ¿ëÀ» ´Þ¶ó°í ÇÒ ¼öµµ ÀÖ½À´Ï´Ù..
»ç¿ëÇϽô ¼¹ö¿¡¼ ¸Þ¸ð¸® ¸ðµâÀÌ ´Þ¶û 2°³ ²ÅÇô Àִµ¥ 1°³°¡ ºÒ·®ÀÌ ³ª¼ ¿¡·¯ »Ñ¸®°í 1°³ Àüü ¿ë·®ÀÌ »ç¿ë ¸øÇÏ°Ô µÇ¸é
¼¹öÀÇ »ç¿ë °¡´ÉÇÑ ¸Þ¸ð¸®¾çÀº ¹ÝÀ¸·Î ÁÙ°í ±× Á¤µµ µÇ¸é ¾Æ¹«¸® ¿ì¼öÇÑ OS¶óµµ ¸ØÃß¾î¼°í ´Ù¿î (ÇÁ¸®Â¡) µÉ ¼ö ÀÖ½À´Ï´Ù..
¸Þ¸ð¸® ¿¡·¯ Å×½ºÆ®¸¦ ¹«¾ùÀ¸·Î ÇÏ¿´´ÂÁö´Â ¸ð¸£Áö¸¸ Å×½ºÆ® ÇÏ´Â ÇÁ·Î±×·¥¸¶´Ù ¿¡·¯°¡ ³ª¿À´Â °ÍÀÌ ´Ù¸£°í
¹ö±×µµ ÀÖÀ» ¼ö Àֱ⿡ ¿À·¡ »ç¿ëÇغ¸°í Àͼ÷ÇÑ ±×¸®°í ¿¡·¯¿¡ ´ëÇÑ ¼³¸íÀÌ ÀߵǾî ÀÖ´Â ÇÁ·Î±×·¥ÀÌ ÁÁ½À´Ï´Ù..
»ç¶÷ÀÌ ´Þ·Á°¡´Ù°¡... ¸· ¶Ù¾î°¡´Ù°¡.... ÀÚºüÁø °Ì´Ï´Ù...
½Ã½ºÅÛ ´Ù¿îµÇ´Â°ÅÁÒ...
ÀÏ´Ü ¸Þ¸ð¸® Á¢Á¡À» ´Û¾Æº¸½Ã°í..
Å×½ºÆ® ÇØ º¸°í.. °è¼Ó ¿¡·¯°¡ ³ª¸é...
¹Ù²Ù¼¼¿ä....