컴퓨터가 자꾸 다운됩니다..

네이쳐   
   조회 4788   추천 0    

 안녕하세요

계산용 리눅스 컴퓨터가 자꾸 다운되서 질문드립니다.


시스템

  - CentOS7

  - Ryzen 1950x

  - 32GB

  - GTX 1080 x 2개


증상은

계산을 해놓으면 낮에 제가 확인할 때는 잘 되는데, 새벽에 다운이 됩니다.

아침에 확인하면 거의 매일 멈춰있습니다.

(단순히 켜 놓기만 한 상태에서는 멈추지 않고 잘 켜져있는거 같습니다.)

(CPU, GPU 온도는 정상입니다.)

하드도 교체해보고 파워도 교체해봤는데 증상이 같은걸 보면 메인보드에 이상이 있는거 같기도 한데.. 잘 모르겠습니다.


/var/log/messages 를 확인해보면 단서를 찾을 수 있을까요?

조언 부탁드립니다..



짧은글 일수록 신중하게.
박문형 2019-04
PCIe BUS 에러가 있네요..

device [1022:1453] 에서만 일어나는 듯합니다만

이게 어떤 PCIe 슬롯이나 디바이스를 지칭하는지 아시는지요??
     
네이쳐 2019-04
처음 구매했을때부터,
리눅스 설치중에, 화면이 깨지면서 뭔가가 떴었거든요.
'Family 17h' 이 문구가 포함되어 있었던거 같습니다.
근데 계산도 잘되고 다운도 안되고 그래서 잘 썼었는데
최근와서 다운이 빈번하게 일어나네요...

검색해보니
PCI 1022 Advanced Micro Devices, Inc. [AMD] 1453 Family 17h (Models 00h-0fh) PCIe GPP Bridge 라고 찾았는데
https://devicehunt.com/view/type/pci/vendor/1022/device/1453

봐도 모르겠네요 ㅎㅎ
as를 보내야 되는 문제인가요?
화란 2019-04
idle 상태는 이상없다고 하셨으니... load시 메인보드 불량아닌가요 ? 설마 CPU는 아닐것 같고... 참고만하세요.
박문형 2019-04
https://forums.unraid.net/topic/69986-solved-problems-on-ryzen-5-with-asus-prime-b350-plus/

잘은 모르겠고 바이오스쪽 IMMOU 쪽을 손봐야 하는가 봅니다..

https://cacaocafe.tistory.com/36

그 외 바이오스에 저런게 있는지 보시고요..

https://blog.goo.ne.jp/amd64er/e/fb8bdc21779807c74c630e479ec8e4e6

사용보드의 PCIe GPP Bridge 가 어떻게 구성되어 있는지 채크 하셔야 할 듯 합니다..


얼핏 생각하기에 VGA를 온보드로 사용한다면 다 죽여 버리시고 따로 저가형 VGA를 달아 보세요..
구차니 2019-04
해당 메시지로 검색해보니 아래글이 나오네요
https://forum.level1techs.com/t/threadripper-pcie-bus-errors/118977
메인보드에서 PCIe를 Gen3에서 Gen2로 설정을 하라는데 언제적 글인지 모르니 확인해보시기 바랍니다.

It's a general problem with Kepler gpus and the X399 chipset, some vendors have bios updates for that. If not, see this:
https://devtalk.nvidia.com/default/topic/1036651/linux/pcie-bus-error-with-two-nvidia-cards-on-linux/
박문형 2019-04
보드가 어느 제조사의 것인지 모르겠지만 (제조사는 몇개 안됩니다만)

이게 하이엔드 PC로 분류 되기에 거의 모든 제조사가 본사에서도 서버 OS에 대해 기술 지원이 불가능 할 것입니다..

보드의 홈페이지 기술지원 사항 보시고 거기서 호환 OS 확인하시면 PC용 윈도우즈만 나올 확률이 높습니다..

드라이버 지원도 마찬가지..
시도니 2019-04
혹시 nvme 를 사용하시지 않으시나요?
김제연 2019-04
gpu  1개 빼고 해보시고 .. 또 다운되면 다른걸 빼고 뺀걸 달고 ..번갈아 가면서 테스트 해보세요 ..
파워는 어떤거 쓰시나요? 한개짜리로 둘다 잘돌아가면 파워 의심해보시구요 ..

그리고 저녁때 모니터를 꺼놓으시나요?
관계가 있을지 모르겠지만... 모니터 꺼놓으시면.. 모니터를 켜놓으시고 테스트 해보시구요 ..
모니터 켜놓으면 잘되면 hdmi 더미 하나 사서 끼워보시구요 ...

이런건.. 그냥 이것저것 테스트 해보시는 방법 밖에는 없을듯
제온프로 2019-04
메인보드에 문제가 있어 보입니다..
보드 교체 하셔야 할 것 같군요..
술이 2019-04
우분투에서 돌려보세요. 커널패닉이라면 CentOS 종특일수도 있습니다. 부하 많이 걸리는 작업 돌릴때 CentOS는 못쓰겠던데 한번 리눅스 OS 바꿔보고 돌려보세요.
초심불패 2019-04
전 amd로 치부 해 버리는 습관이 있습니다.
보드든 cpu든간에요.
딱히 찾을려면 하나 하나 테스트 해 보는 수밖에 없으나 그게 vga일수도 보드 일수도 cpu일수도 있습니다.


QnA
제목Page 3417/5725
2014-05   5246141   정은준1
2015-12   1771488   백메가
01-08   1040   마왕
2012-09   7376   NiteFlite9
2019-02   3519   늘파란
2012-09   6827   2CPU최주희
2012-09   16770   회원K
2016-10   10311   무아
2017-11   3739   일론머스크
2009-07   6847   푸릉이
2016-10   6238   뮤라
2021-08   5769   가온누리I강…
2015-11   4293   김건우
2017-11   8799   주태백
2014-07   13771   cpueblo
2017-11   4784   장동건2014
2015-11   4169   쿠쿠다스
2015-11   3845   김건우
2009-08   6657   왕용필
2014-07   5924   혁군
2017-12   4029   심사숙고
02-24   612   패킷스트림