하드디스크의 고장의 전조 증상 또는 즉사의 비율이 궁금합니다.

정무현   
   조회 3117   추천 0    

쪽팔리면 질문하지 맙시다. 소중한 답변 댓글을 삭제하는건 부끄러운 일 입니다 


표현히 그렇긴 합니다만,

전체 고장하드 중 


전조증상으로서 베드 섹터가 올라가거나 하는식의 골골되다가 고장 나는 경우

아무 갑자기 이유없이 즉사


하는 경우의 비율을 좀 알고 싶습니다.


환경 관리(IDC에서 운용)가 잘된 상태에서

하드 상태 모니터링를 철저히 하면,
고장 대응, 예방 수준이 어느정도인지 알고 싶어서 입니다.

짧은글 일수록 신중하게.
박문형 2023-06
SMART 값이 변하고 배드섹터가 늘어나고 계속 사용하면 얼마 안되서 하드는 죽는다고 보셔도 됩니다..

배드섹터가 늘어나고 몇 일되면 딱 죽는다라는 원칙은 없습니다..

사용되는 하드들의 읽고 쓰는 부하량은 각기 다 다르니까요..
epowergate 2023-06
대부분 predictive failure message가 나옵니다
경험상 이 메시지가 나오면 1시간 ~ 3일 사이에 죽습니다
대략 다음과 같습니다
Severity: Warning, Category: Storage, MessageID: PDR16, Message: Predictive failure reported for Disk 7 in Backplane 1 of Integrated RAID Controller 1.
다음에
Predictive drive is failed: Port 1I Box 1 Bay 21
     
제온프로 2023-06
여기서 Raid 의 중요성이 감지 되는군요.
메세지 나오면

그냥 빼는 것으로......
션한맥주 2023-06
smart 값에서 경고 뜨고 해도 계속 그 상태인 것도 있었고,
갑자기 시스템이 죽어서 확인 해보니 이미 불량난 것도 있었고.
딸깍딸깍 소리 내다가 백업 끝나고 재부팅 하니 인식 안 됐던 적도 있었습니다.

HDD는 거의 시게이트였고,
SSD는 거의 인텔이나 비주류 제조사였습니다.
     
죠슈아 2023-06
인텔 SSD 급사 되는 경우가 많은 것 같군요.
제 경우에도 갑자기  PC가 꺼지고 리부팅 하니  인식 불능 ,,,
검은콩 2023-06
일전에 stablebit drivepool and scanner라는 sw를 이용한 적이 있어요.
그게 s.m.a.r.t를 읽고 에러나면 거기 디스크에 있는 내용물을 전부 다른 디스크로 복제해주는 건데
그거 사용하다가
망했습니다 그냥 ㅋ...
옮기기전에 망가졌어요
클라우드 스토리지 업체 백블레이즈가 발표하는 드라이브 통계가 있습니다.

2023년 1분기 Backblaze 드라이브 통계
https://www.backblaze.com/blog/backblaze-drive-stats-for-q1-2023/

해당사IDC에서 사용하는 드라이브 모델과 용량, 수량, 고장건수 등을 나타내주는 Report 인데,
절대값은 아니겠지만 참고하라는 의미에서 자료가 나와 있네요.
박문형 2023-06
개인적으로 사용하는 하드를 교환해야 하는 시기는 배드섹터가 발견되고 늘어나기 시작하는 때라고 생각합니다..

그러나 그것을 재대로 감지하려면 하드를 우선 로우레벨포맷이나 제로필 테스트를 해야 합니다..

최소 하루 이상 몇일씩 걸리는 작업입니다.. 어찌 보면 시간 낭비일 수도 있습니다..



아시겠지만 하드도 무상 AS기간이 있습니다.. 모델에 따라 틀리지만 1/3/5년 정도이지요..

만일 회사에서 사용하는 하드이고 운영하시는데 자본의 여유가 있다면 3년 정도 사용하면 새 하드를 구해 하드를 교체하고

사용하던 하드는 폐기해버리는 방법이 있습니다..

급작스러운 하드의 죽음에는 대처하지 못하지만 그냥 죽을 때까지 사용하자 라고 하다가 여러 개의 하드가 동시 다발적으로 고장나는 사태는 피할 수 있습니다..

하드의 고장에 대해 어떻게 대처하고 해결하는지에 대해서는 원칙이 없습니다..

운영을 해봐야 노하우가 생깁니다..

그리고 하드디스크 갈아 재끼는 것보다 더 중요한 것이 백업입니다..

확실한 백업과 리스토어 만이 데이터를 망실하지 않고 오래 보관 할 수 있습니다..


워런티 1년짜리 개인용 하드도 하루 24시간 중 12시간만 사용한다고 하고 부하를 계속 주지 않는 경우 대략 최대 사용 기간이 5~10년 정도 인 듯합니다..

잘 아시겠지만 하드는 케바케이고 설치 하자마자 즉사도 합니다..
달광이 2023-06
구글에서 논문을 낸적이 있는데
보통 하드는 3-6개월 이내에 고장이 나지 않으면 5년 동안 문제가 없다고 합니다.
전원이 내려갔다 올라 올때 문제가 가장 많이 발생하고, 5-6년이 지나면 대부분 문제가 생기기 시작한다고..

근데 이건 좀 엔터프라이즈 시스템 위주인것 같긴 합니다.
저도 7년돈 2테라 하드 잘 쓰고 있다보니..
     
dateno1 2023-06
5년 아마 엔터나 NAS용 같은 비싼넘 기준일껍니다

일반 저렴한넘은 2~3년정도면 문제 생기기 시작합니다
     
술이 2023-06
복불복입니다.
엔터프라이즈 하드 한달 주기로 줄줄이 사망한 케이스 경험하고 나서 안믿습니다.
dateno1 2023-06
어차피 그런곳 시끄러워서 이상한 소리나도 눈치 못 챌 가능성 크니 이쪽을 감지할 가능성은 거의 없다고 봅니다

갑자기 볼름이 느려지거나, SMART가 변동되는게 대부분의 경우 발견된 징조입니다

물른 아무것도 없이 갑자기 안 돌아가고 죽는 경우도 있지만, 대부분의 경우 전조는 있습니다

자금등의 여유가 있다면 평균적인 사망 주기 (보통은 보증기간보다 조금 더 깁니다)를 채우면 멀쩡해도 교체하는게 안전하겠지만, 보통 거기까지 사정이 안 받쳐주죠

다만 이런 부분 완전히 무시하고 오래된 디스크들만으로 볼름 구성해두면 단체로 드러눕거나, 리빌드하다가 줄초상 치루어서 망하는 경우 있습니다
정무현 2023-06
다들 조언 감사합니다.
sbg2005 2023-06
개인적인 경험입니다만,,,

SSD의 경우에는
레이드 컨트롤러에서 Predictive Failure 로 감지하는 것 보다 그냥 봤더니 고장나있더라 인 상황이 좀 더 많은 것 같습니다.

HDD의 경우에는 대부분 IO 지연시간이 늘어진다던가 등등의 이유로 사전 감지가 되거나 SMART 값 변동으로 사전 감지가 잘 되기는 하는데, 마찬가지로 급사 비율도 무시 못 하더군요.


QnA
제목Page 305/5724
2014-05   5238359   정은준1
2015-12   1763929   백메가
2023-07   2236   kty9906
2023-07   3510   검은콩
2023-07   2475   캡틴아메리카노
2023-07   2518   2CPU최주희
2023-07   2575   포병
2023-07   3076   AKA지니
2023-07   2333   keros
2023-07   2257   김제연
2023-07   4533   블루모션
2023-07   2164   홀릭0o0
2023-06   2668   sbg2005
2023-06   2192   epowergate
2023-06   2444   화란
2023-06   2936   메탈포스
2023-06   2944   김한국2
2023-06   3883   쓰레기단장
2023-06   1624   hdsniper
2023-06   1563   블루썬
2023-06   3118   정무현
2023-06   2373   서울강북미…