서버가 메모리 오류를 뱉어내며 리붓될까요 아니면 오류난 메모리를 제외하고 실제 정상적인 메모리만 운영하면서 억지로 돌아갈까요?
최근에 서버 덤프 떨어지면서 덤프봤더니 패리티 에러가 계속 발생하면서 뻗었더라구요.
그러고 난후 리붓되고 계속 돌다가 일주일 지나고 서버에서 삑 삑 삑 계속 소리나면서...
희안한건 저정도 되면 멈추거나 부팅이 안되거나 죽어야 정상인데 일부서비스는 계속 돌고 있다는게 신기.
이제까지 REG 메모리도 메모리 하나 불량나면 부팅불가에 무한 리부팅으로 서버가 작동안했는데 리부팅 될때까지는 메모리 오류 소리 내면서도 일부서비스는 계속 돌아간다는거에 신기했습니다.
이게 ECC의 장점인지 아니면 우연의 일치인지는 잘모르겠습니다.
그런데 뽑기를 잘못했나 왠간하면 메모리 잘 안죽는데 하나가 불량난거 보면 ECC 기능때문에 메모리 열을 많이 받는건지 희안한 증상이긴 했습니다.
FBDIMM ¾²´ø ¼¹öµéÀÌ ³ëÈÄÈµÇ¸é¼ ±×·± °æ¿ì¸¦ ¸î ¹ø ºÃ´Âµ¥, ECC¿¡ ÀÇÇØ »¸Áö´Â ¾Ê°í Á¤»ó µ¿À۵Ǵ °ÍÀ» º¼ ¼ö ÀÖ¾ú½À´Ï´Ù.
ECC´Â ½Ì±Û Æи®Æ¼ ¿À·ù°¡ ¹ß»ýÇßÀ» °æ¿ì °ËÃâ°ú Á¤Á¤ÀÌ °¡´ÉÇϸç (º¥´õ¿¡ µû¶ó ºñÇÁÀ½ÀÌ ³¯ ¼öµµ ÀÖ°í, ¾È ³¯¼öµµ ÀÖ½À´Ï´Ù. OS ·Î±×¿¡ ÂïÈ÷´Ï ±×°É º¸´Â °Ô °¡Àå È®½ÇÇÕ´Ï´Ù.), ´õºí Æи®Æ¼ ¿À·ù°¡ ¹ß»ýÇßÀ» °æ¿ì °ËÃâÀº °¡´ÉÇÕ´Ï´Ù. (º¥´õ¿¡ µû¶ó¼ ¸®º×ÀÌ µÉ ¼öµµ ÀÖ°í, ºñÇÁÀ½À̳ª ·Î±×¸¸ ÂïÈú ¼öµµ ÀÖ½À´Ï´Ù.)
ÀúÈñ ¼¹öÁß ÇϳªÀÇ ¼¹ö¿¡¼ ¸Þ¸ð¸® ¿¡·¯°¡ ¹ß»ýÇß½À´Ï´Ù.
±Ùµ¥ ºÎÆõµ ºñ±³Àû Á¤»óÀûÀ¸·Î µÇ°í (10¹øÁß 9¹øÀº ºÎÆüº°ø) ¼¹ö½ÇÇ൵ Á¤»óÀûÀ¸·Î(ºÎÆüº°ø½Ã ¼¹ö½ÇÇàÀº 100% º¸ÀåµÊ) µË´Ï´Ù.
Çåµ¥ ¾î´À³¯ °©Àڱ⠼¹ö°¡ Á×¾î¹ö¸³´Ï´Ù. Á×À»¶§ »àÇÏ°í Á×Àº´ÙÀ½¿¡ ¸®ºÎÆõǴ°ÍÀÌ ¾Æ´Ï¶ó ±×´ë·Î ¸ØÃç¹ö¸³´Ï´Ù.
°¡²û »à~ ÇÏ¸é¼ °è¼Ó ºñ¸íÀ» Áö¸£°í Á×¾î¹ö¸®´Â °æ¿ìµµ ÀÖ°í¿ä. ±×·¡µµ ÀÚµ¿ ¸®ºÎÆÃÀº µÇÁö ¾Ê½À´Ï´Ù.
°á±¹ ¸Þ¸ð¸® ¿¡·¯·Î ÆľǵǾú½À´Ï´Ù.
ÆÄ¾ÇµÈ ¹Ù·Î´Â ¿¡·¯³ ¸Þ¸ð¸®´Â °¡Àå ¸¶Áö¸· ¹ðÅ©¿¡ ²ÈÇô ÀÖ¾î°í¿ä ½Ã½ºÅÛÀÌ µ¹¾Æ°¡´Ù°¡ ÇØ´ç ¸Þ¸ð¸®¿¡ Á¢±ÙÇÏ°Ô µÇ¸é
¼¹ö°¡ Á¤ÁöÇÏ´Â °ÍÀ¸·Î ÆľǵǾú½À´Ï´Ù.
¾Æ¸¶µµ ÀνÄÀº µÇ³ª º»°ÝÀûÀ¸·Î READ/WRITE¸¦ ¸¶±¸¸¶±¸ ÇØ´ë´Â ÀÛ¾÷ÀÌ ½ÃÀ۵Ǹé ÇØ´ç ¸Þ¸ð¸®¿¡¼ ¿¡·¯¸¦ ³»¸é¼ ¼¹ö°¡ Á״°Ͱ°½À´Ï´Ù.
´Ô ¼¹ö¿Í ¶È°°Áö´Â ¾ÊÁö¸¸ ºñ½ÁÇÏÁÒ. ¸Þ¸ð¸® ¿¡·¯´Â ³ª´Âµ¥ ½Ã½ºÅÛÀÌ ½ÇÇàµÇ´Â°Ô.
¿©ÇÏÆ° ÇØ´ç ¸Þ¸ð¸® Á¦°ÅÇÏ°í Çѽø§ ³õ¾Ò½À´Ï´Ù.
¼¹ö°¡ Á×´Â ÀÌÀ¯°¡ ¸Þ¸ð¸®¹®Á¦¶ó´Â°ÍÀ» ¾Ë¾Æ³»´Âµ¥ 6°³¿ùÀº °É¸°°Í °°½À´Ï´Ù. ÀúÈò ºÎÆýà ¸Þ¸ð¸® ¿¡·¯°¡ ³´Ù´Â ¸Þ¼¼Áö³ª Åõ´ú°Å¸²ÀÌ ¾ø¾ú°Åµç¿ä.
´öºÐ¿¡ ¼¹ö¿·¿¡¼ ¼¹ö°¡ ¾ðÁ¦ Á׳ª ÇÏ¿°¾øÀÌ ±â´Ù·È½À´Ï´Ù. Á×À¸¸é ²¯´Ù ÄѾßÇϴϱî.
»ý°¢º¸´Ù ¼¹öµµ Âü ¸¹ÀÌ ¼ÓÀ» ½â¿©¿ä.