일주일에 한번씩 하드디스크 2개가 동시에 배드 에러가 납니다.
kernel: sd 1:0:0:0: [sdc] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
Feb 4 13:53:59 localhost kernel: sd 1:0:1:0: [sdd] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
Feb 4 13:53:59 localhost kernel: sd 1:0:1:0: [sdd] CDB: Read(10): 28 00 6b 25 f8 b0 00 00 08 00
Feb 4 13:53:59 localhost kernel: sd 1:0:1:0: [sdd] Unhandled error code
그런데 서버를 재시작하면 언제 그랬냐는듯이 멀쩡합니다.
마운트 접속 모두 이상없고 fsck로 검사해도 멀쩡합니다.
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 171 169 021 Pre-fail Always - 4433
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 34
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 084 084 000 Old_age Always - 11721
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 33
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 30
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 3
194 Temperature_Celsius 0x0022 105 091 000 Old_age Always - 42
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 1
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 456
3 Spin_Up_Time 0x0027 219 170 021 Pre-fail Always - 2025
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 98
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 001 000 Old_age Always - 0
9 Power_On_Hours 0x0032 075 075 000 Old_age Always - 18943
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 93
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 64
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 33
194 Temperature_Celsius 0x0022 104 092 000 Old_age Always - 43
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 1
198 Offline_Uncorrectable 0x0030 200 200 000 Old_age Offline - 1
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 6
200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 1
하드 건강상태 정보는 위와 같습니다.
모델은 둘다 웬디 블랙 1TB모델입니다.
전체 총 6개의 하드가 연결되어 있으며 에너맥스 550w 파워에
CPU는 Q6600, 메모리 8G이고 IDC에 입고되어 있습니다.
거의 한달에 걸쳐서 일주일에 한번씩 에러나고
재시작하면 멀쩡해지는 과정을 반복하고 있습니다.
전원이 부족한건지 내부가 더워서 그런건지 SATA케이블이 낡아서 그런건지
참고로 다른 하드들은 아무런 에러없이 멀쩡이 서비스 되고 있습니다.
살펴보시고 조언 부탁드립니다.
감사합니다.
½¬¿î ¹æ¹ýÀ¸·Î ÄÉÀ̺í -> ÆÄ¿ö -> ÄÁÆ®·Ñ·¯ ¼øÀ¸·Î Á¡°ËÇغ¸½Ã´Â°Íµµ ÁÁ½À´Ï´Ù.
½Ç·ÊÁö¸¸ ÀÌ°Å ¾î¶»°Ô ¾î¶»°Ô Çؼ »ç¿ëÇÏ¸é ³ªÁß¿¡ SQL µ¥ÀÌÅÍ°°Àº°Å ±úÁö¸é ¿£Áö´Ï¾î¸µ ¾÷ü¿¡ µ· ¾Æ¹«¸® Á൵ º¹±¸µµ ¸øÇÕ´Ï´Ù
ÆÄÀÏ »ì·Áµµ ´õ¹Ì°¡ µÇ´Ï±î¿ä.
¸Þ¸ð¸®¸¦ Æ÷ÇÔÇÑ º¸µå, ȤÀº ±â±â ÀÚü¸¦ ¹Ù²Ù¼Å¾ßµË´Ï´Ù.
ÀÌ¹Ì ±³Ã¼½Ã±â°¡ ÇÑÂü Áö³µ´ÂÁö ¸ð¸£°Ú½À´Ï´Ù.
Çϵåµð½ºÅ© ¿Âµµ°¡ 40-50µµ¶ó Ä𷯱³Ã¼ ¹× ÄÉÀÌºí ±³Ã¼¸¦ ½ÃµµÇغ¸°í
¾ÈµÇ¸é ½Ã½ºÅÛ Àüü ±³Ã¼¸¦ °í·ÁÇØ º¸°Ú½À´Ï´Ù.
7³âÀ̸é ĨóÇ×À̳ª ¼¼¶ó¹ÍÄܵ§¼µé°°ÀÌ Ã¼Å©°¡ Èûµç ºÎÇ°µé ¿Èµµ ¹«½Ã ¸øÇÕ´Ï´Ù.
¾ÏÆ° ¹¹ º° ÀÌ»ó ¾Æ´Ï¸é ÁÁ°Ú³×¿ä. Àß ÇØ°áµÇ½Ã±â ¹Ù¶ø´Ï´Ù.