수랭쿨러 수리 관련 질문

어석   
   조회 1839   추천 0    

안녕하세요.

약 5년정도 사용한 수냉 서버가 망가졌습니다.

일단 구매 업체에 수리중에 있긴 한데, 교체 비용이 워낙 만만치 않아서 조언 구하려고 질문올립니다.


일단 머신은 NVIDIA DGX Station입니다.

지금까지 진행한 수리 내역은 아래와 같습니다.


문제 : BIOS 부팅시 고열로인해 진행 불가.

수리 : 1. 수냉 쿨러 교체 (부팅은 진행이되나 아이들 74도 정도 나옴)

         2. 써멀 구리스 등 교체 후 테스트 (여전히 동일) 


업체측에서 냉각라인 분리해보니 아래 사진과 같다고 합니다.

이제 용액 교체를 진행하려고 하는데, 혹시 다른 것 점검할 것이 없을까요?




또한 걱정인게 환경이 열악하여 (적절한 항온 항습 시스템을 못만들어서 열을 그대로 받고 있습니다.) 그런것 같은데 혹시 원인을 아시는 분 계시려나요..?

비슷한 경험 해보신 분 있으면 알려주시면 큰 도움 될 것 같습니다.


감사합니다.



짧은글 일수록 신중하게.
박문형 2024-04
글쎄요..

개인적으로 보기에는 (개인적 의견은)

항온 항습이 재대로 안되는 곳에서 5년 동안 동작해주었다는 것 자체만으로 행운이라고 생각합니다..

일반 랙마운트 서버도 IDC같은 것에서 5년 동작했으면 수명이 다했다 라고도 볼 수 있습니다..

GPU 서버는 한마디로 전기 난로나 전기 스토브를 계속 켜두는 것과 같습니다.. 그만큼 전기를 많이 먹고 열도 많이 납니다..

어떤 컴퓨터이든 간에 열이 많은 곳에서 동작하면 빨리 고장 납니다..

서버가 놓인 곳의 온도 문제부터 해결하셔야 그나마 서버를 조금 더 사용하실 듯합니다..(얼마나 더 사용 가능하다는 것은 모릅니다..)


수냉에 관해서는 사진으로 볼 때 용액 교체 외에 내부 청소도 해주어야 할 듯한데 용액 교체라는 작업에 내부 청소도 포함되어 있나요??

용액 교체 후에도 이 문제( BIOS 부팅시 고열로 인해 진행 불가.)가 계속된다면 시스템 자체가 수명이 다했다라고 봐야 합니다..
     
어석 2024-04
답변 감사합니다.
용액 교체 시에는 청소 작업도 포함되어 있다고 합니다.
용액 교체후에도 문제가 계속되면, GPU 블럭 쪽 교체해볼수도 있다고 하는데 가격이 너무 많이 나가서..
어쨋거나 좋은 상황은 아니군요..
          
박문형 2024-04
테스트 하는 업체에서 우선 열이 많이 나니까 열을 잡는다고 수냉쪽부터 보는 듯합니다..

그런데 서버 테스트에 대한 항목은 질문안에는 전혀 없네요..

수냉 쿨러 보수한 다음 서버의 동작이 이상없는지 어디가 문제인지 하는 서버테스트는 어떻게 하였는지는 모르시는지요??

그리고  NVIDIA DGX Station 도 아마 모델이 여러가지 있을텐데 사용하시는 GPU 모델명은 대략 어떻게 되나요??
민경열 2024-04
수냉 배관은 전부 교체가 된 건가요? (동맹경화 는 뚤어야죠.)
수냉 FAN 은 정상 풍량이 나오는건가요? (기타 다른 FAN 도 점검 해야죠.)

그래도 정 안되면, 옆판을 열고 쓰시는게
     
어석 2024-04
아마 배관은 전부 교체된 것 같습니다.
20만원정도 청구받고 교체한다고 하였으니까요..
답변 감사합니다.
제온프로 2024-04
수냉은 1년에 한번씩은 메인터넌스를 하셨어야 하는데..
그냥 계속 쓰셨네요..
내부 로직보드들 이미 열을 먹어서..
손상 됬을 것으로 보입니다.
     
어석 2024-04
아이고 그렇군요..
주기적으로 메인터넌스해야하는지도 잘 몰랐네요.
윗분들 말처럼 여기까지 온게 기적일수도 있겠네요..
          
제온프로 2024-04
네 맞아요.... 수냉으로 5년 쓰셨다니 깜짝 놀랐습니다.
보통 수냉은 2년 가기 힘들더군요..
이걸로 보아 냉각없이 1~2년 정도 운영이 되었던 것 같아요...
제온프로 2024-04
위 사진은 열에 의해서 가열되어 증발하고..

점점 걸쭉해 졌어요.. 그리고 결국 구멍들이 막힌 것이죠.
     
어석 2024-05
다행히 세척 및 교체로 수리가 완료되었습니다.
감사합니다.
죠슈아 2024-04
히트싱크 재질에 부합하지 않은 냉각수를 넣어서 산화되어 점성이 생긴 것으로 보입니다.
펌프, 배관 모두 분해해서 세척하면 재사용 가능하겠지만 점성이 생긴 냉각수가 증착 되었다면 교체해야 합니다.
정성이 발생한 액체는 히트싱크의 금속을 부식시킨것으로 이것이 증착되면 발열을 방해 하므로 ,,,
CPU 워터블럭에도 동일한 루프에 연결되었다면  이것은 세척이 불가능할 겁니다.
사진에 보이는 GPU 블럭에도 얇은 핀들이 모두 막혀 있군요...

루프 전체가 동일한 재질의 워터블럭 사용과  이에 맞는 수냉전용 냉각수를 사용했다면 저런 식으로 엉망이 되지는 않습니다.
그리고 냉각수 루프중 일부는 외부에서 보이게해 놓을텐데 ..  저런 상태가 된 것을 업체 불러서 분해해서 알 수 있었다는 것은
처음부터 냉각 루프를 잘못 빌드한 것 입니다.
아마도 ...  경험 없는 분이 자력으로 빌드한 것으로 보이는 군요...
FlowerSmith 01-02
*비밀글입니다


QnA
제목Page 151/5731
2015-12   1793645   백메가
2014-05   5268635   정은준1
2024-04   1826   공백2
2024-04   1598   신우섭
2024-04   1767   라이크유
2024-04   1586   L2스위치
2024-04   2150   L2스위치
2024-04   1972   L2스위치
2024-04   1669   스무프
2024-04   1568   2CPU최주희
2024-04   1633   Sakura24
2024-04   3496   을신축
2024-04   2197   대전김형운
2024-04   2177   액체와컴퓨터
2024-04   2165   구차니
2024-04   1787   스무프
2024-04   2033   미담
2024-04   4344   우럭아왜우럭
2024-04   2496   전직P연구원
2024-04   3039   전일장
2024-04   2296   online9
2024-04   2519   액체와컴퓨터