안녕하세요.
어제 HP DL360 GEN10 모델의 전면부 LED 의 빨간불 점멸 건으로 질문 드렸었는데,
많은 분들께서 도움 주신 덕분에 원인을 찾았습니다.
감사드립니다.
빨간불 점멸의 원인은 디스크 사용량 때문 이였습니다.
약 7개월 전에 구입한 삼성 NVME SSD 980 PRO 2TB 가 사용량이 5522.8TB를 썼다고 나옵니다.
삼성 SSD A/S 문의를 하니, 보증하는 TBW 는 1200 이므로 A/S 를 해줄 수 없다고 합니다.
삼성 메지션이라는 프로그램을 설치 해서 내용을 살펴 보면 아래와 같습니다.
펌웨어 : 5B2QGXA7
Byte End | Byte Start | Description | Raw Data |
0 | 0 | Critical Warning | 4 |
2 | 1 | Temperature (K) | 314 |
3 | 3 | Available Spare | 100 |
4 | 4 | Available Spare Threshold | 10 |
5 | 5 | Percentage Used | 136 |
47 | 32 | Data Units Read | 223129931 |
63 | 48 | Data Units Written | 11860216646 |
79 | 64 | Host Read Commands | 2521097408 |
95 | 80 | Host Write Commands | 17710845388 |
111 | 96 | Controller Busy Time | 103490 |
127 | 112 | Power Cycles | 17 |
143 | 128 | Power On Hours | 5361 |
159 | 144 | Unsafe Shutdowns | 5 |
175 | 160 | Media Errors | 0 |
191 | 176 | Number of Error Information Log Entries | 0 |
195 | 192 | Warning Composite Temperature Time | 0 |
199 | 196 | Critical Composite Temperature Time | 0 |
201 | 200 | Temperature Sensor 1 | 314 |
203 | 202 | Temperature Sensor 2 | 317 |
205 | 204 | Temperature Sensor 3 | 0 |
207 | 206 | Temperature Sensor 4 | 0 |
209 | 208 | Temperature Sensor 5 | 0 |
211 | 210 | Temperature Sensor 6 | 0 |
213 | 212 | Temperature Sensor 7 | 0 |
215 | 214 | Temperature Sensor 8 | 0 |
중간에 작동시간 보면 5361 시간으로 기록되어 있습니다.
그리고 사용한 5522 TB 를 참고로 계산해보 면
1시간당 1054GB 를 꼬박 쓴걸로 계산 됩니다. (1초당 300Mb 씩 7개월 동안 계속...)
상식적으로 이해가 안되는 기록 입니다.
HP DL360 GEN10 모델에 PCI-E 카드를 껴서 NVME 를 사용중입니다.
OS 는 winserver 2022 이고 NVME 에는 HyperV 게스트만 올려서 사용중 입니다.
전체 2tb 중에 600GB 만 이용 중에 있습니다.
HpyerV는 보통 10대 정도만 돌아가며 한대당 차지하는 실제 하드 공간은 25gb 정도 됩니다.
이 게스트 HyperV는 코인사이트들 위주로 크롤링 하는데, 하루에 많이 작동해봐야 5시간 남짓 합니다.
이러한 작업들이 결코 1초에 300MB 를 쓸것 같지는 않아서 더 의문입니다.
(그리고 인터넷 사용량 제한이 있어 하루에 150G 를 넘지 못합니다. 실제 다른 서버와 분산되어 있으니 하루 50G 전후 일듯 합니다.)
그리고 이전에
HP DL360 GEN8 모델을 썼었습니다.
서버용이 아닌 삼성 860 EVO 512GB 모델이나 가끔 장터에 올라오는 중고 SSD 물려서 최소 3년 이상은
전원 차단 없이 막 굴렸었습니다. (HyperV 수십대 이상 동시에 돌리는 등..)
그때는 SSD 가 어떠한 이상 증상도 없이 수년간 잘 버티고 지금도 잘 버티고 있습니다.
이 NVME SSD 는 왜 이런 현상이 나타났는지 모르겠습니다.
일단 삼성 A/S 에서 TBW가 1200 을 넘어서 A/S 불가 라고 했지만, 점검이라도 해달라고
보낼 예정 입니다.
제가 정말 7개월 만에 5522 TB 를 썼을 까요.
초보적인 질문에도 정성껏 달아주신 댓글에 늘 감사를 느낌니다.
==========================================================================================
사진 추가 하였습니다.
5522TB 사용 하였다는 화면
5364 Hours ㎢募화면.
삼성 자체 모니터링 에서 평균 4.3MB/S ㎢鳴나온 화면 입니다.
일주일 이상 모니터링 해보겠습니다.
==========================================================================================
사용량 평균 데이터 캡쳐 사진 추가 했습니다.
HyperV 의 게스트가 15개 돌고 있을때 입니다.
각 게스트는 수초에 한번 코인 관련 사이트를 방문하여 데이터를 수집 합니다.
또한, 수시간에 한번씩 재부팅 까지 합니다.
그럼에도 불구하고 쓰기 사용량은 3MB/s 이하 입니다.
제가 무슨일인지 모르지만 HyperV 게스트가 유닉스에서 메모리가 부족해서 스왑을 엄청 사용하는것처럼 동작해서
원인을 찾을수도 없어서 그냥 날려 버린 경험이 있습니다.
초당 5MB 내외의 쓰기만 기록 되고 있습니다.
메모리SWAP 관련해서 구글링 해보겠습니다.
이 상태에서 디스크 사용량 속도로 체크해보면 답 나오겠죠
읽기,쓰기 초딩 5MB 내외 입니다.
특이사항을 발견하기가 어렵네요.
vm 죄다 idle이라도 메가단위 뜹니다
테스트 중인 위 서버도, 다른 구닥다리 서버도 그렇고 15개까지 돌렸을 때 많이 써봐야 3MB/s 전으로 나옵니다.
성능모니터, 삼성메지션 모두 비슷한 값이 나와서 신뢰 할 수 있는 수치로 보입니다.
각 게스트는 윈10 올라가 있는 상태 이며 idle 이 아닌 작업중인 상태 입니다.
설마 단체로 크롤링하는데도 저정도인건가요?
참고로 저런 사용량 찍힌건 아마 펌 버그에요
격하게 하지는 않지만,, 수초에 한번 크롤링합니다.
아무래도 펌웨어 버그 인것 같습니다.
그랬으면 좋겠습니다.
참고로 버그로 저래도 알짤없이 거부당해요
단지 삼성이나 하이닉스에 비해 가격은 저렴하면서 5년 보증하는 제품들입니다..
감사합니다.
2280 엔터는 꽤나 환상종이고, 가격도 정상이 아니라 추천하기 미묘하네요
아니면 라이저 써서 U.2 가세요
엄청나게 쓰셨네요..
지금까지 가장높은 수명이 28 페타 정도 이니까...(히타치 SAS SSD)
서버가 사용량이 많군요..
캐쉬로 썼다면..... 이해는 갑니다..
님은 사용량이 많아서 Hard 를 쓰셔야 겠네요....... 어쩔 수 없이
좀 더 굴려서 어디 까지 쓸수 있나 써보고 싶기도 하네요.
원하지 않은 상황 였지만..
컴퓨터는 거짓말을 하지 않으니......
그럼 범인은 HyperVisor 아니면 VM 이죠 아니면 VM 내부의 서비스 !!!.???
그냥 편하게 하드드라이브 쓰세요.. 4TB 여러개 레이드 10 걸면 빨라져요..
이걸로써 980 Pro 의 내구성을 보왔습니다.
보증 TBW보다 4배정도 더 가는군요...
역시 980 Pro
납득이 않가는 수치입니다.
삼성 980 pro의 펌웨어 오류 일수도 있으니.
한번 날카롭게 대응해 보시길 바랍니다.
그돈으로 그냥 엔터 중고라도 사는게 나아보입니다
나는 1KB짜리 파일을 삭제했지만, SSD는 64KB 블럭을 삭제하고 다시 기록할 수도 있기 때문입니다.
또, SLC 캐싱기능이 있는 TLC SSD라면, 1MB를 기록하면 SLC모드로 3MB 기록하고 다시 TLC모드로 1MB 기록하고, 이런 형식일지도 모릅니다.
그런데.. 이런점을 감안하더라도 쓰기량이 지나치게 많기는 하네요.
일단 원인을 찾고나서 대안을 찾으신다고 했는데, 그렇게 하긴 해야 할 것으로 보이긴 합니다.
너무 비정상적입니다.
저도 가격때문에, 소비자용 m.2 NVMe SSD를 사용하곤 했었는데..
쓰기 수명이 넘사벽이라 U.2 기업용 SSD로 교체하곤 마음 편하게 씁니다.
U.2 기업용 SSD, 특히 PCIe 3.0 까지만 지원하는 인텔 SSD가 싸게 많이 풀려있습니다.
(국내에서 못 찾으면 이메이/아마존/뉴에그)
초기비용은 좀 비싸지만, 정말 마음에 평화를 얻습니다.
기업용으로 가세요.
SSD는 괜히 기업용이 아니더랍니다.
그 비싸던 옵테인이 가격 저꼴이니까요
이외에 Micron꺼 할인할때 사도 쌉니다
--> 이 제품을 구하려다 시간이 촉박해서 삼성980 PRO 로 갔네요.
지금 검색해서 보니 쓰기 수명이 17.52 PBW 네요.
일반용에 비해 10배 이상의 수명이라 무척 듬직해 보입니다.
이런넘 테라단위 용량 사면 이거 절대 다 못 채우겠구나란 생각밖에 안 들어요
펌웨어를 최신으로 업데이트 해보세요..
다만 비정상적 상승은 막아주겠죠