서버가 꺼지는현상이 너무심각합니다 ..

Lucyed   
   조회 10459   추천 0    


제가 약 한달전에도 이런글을 적었습니다. 


DELL poweredge R710 을 사용하던도중  이벤트로그에 41 Kernel-power 로 서버가 꺼지라구요 

그래서 2cpu 회원님들이 제공해주신 해결법이나 문제사항들을 읽어보고 하나하나수정했습니다 .. OS 재설치, 파워교체.. 서멀구리스

등등을 해보아도 안되서 메인보드 문제라는분들도 있어서 서버컴퓨터를 DL360 g6 로 교체후 r710 부품들을 옮겨서 사용하던중에 

오늘도 두차례나 꺼졌네요 ..   " PC에 문제가 발생하여 다시 시작해야 합니다. 일부 오류 정보를 수집하고 있습니다. 그런 다음 자동으로 다시 시작합니다.     자세한 내용을 보려면 나중에 온라인에서 이 오류를 검색할 수 있습니다. DPC_WATCHDOG_VIOLATION "  라고 뜨면서 자동으로 꺼진후 재부팅됩니다..  그래서 혹여나 CPU 온도가 너무높아서그런것은 아닐까 해서 체크해보았지만 다른서버(안꺼지는서버) 들보다 낮은걸 확인할 수 있엇습니다.  도대체 무슨 문제일까요 ? 제가사용하고있는 SSD ?    메모리? ..  어느것이 문제인지 알수있을까요 ? 그리고 해결법도요 .. 부탁드리겠습니다..

 

짧은글 일수록 신중하게.
김황중 2016-07
혹시 그동안 이 서버들을 사용하기전에도 다른 서버를 사용해 보신적이 있으신가요?
있으시다면 기종이......

현재 서버에 설치된 프로그램등이 일단 의심됩니다.
OS 또한 클린 파일을 설치하셨는지도....

해당 오류 메세지에 대한 원인은
하드웨어, 소프트웨어, 드라이버, 레지스트리,  바이러스, 시스템 파일 손상, 하드오류, 메모리 오류등으로 발생되게 됩니다.

일단은 OS를 설치된 하드를 제거하고
단순 부팅만 시키고 RBSU에 진입하시고 하루정도 계속 켜놔보세요.
그래도 다운이 되는지...
(두대에서 모두 발생되니 하드웨어 이슈는 아닐듯 싶네요)

이후 OS외 소프트웨어등도 한개씩 설치해 가면서 하루씩 지켜보면 무엇이 원인인지 찾아 내실수 있을듯 싶네요.
     
Lucyed 2016-07
프로그램들은  몇개없습니다..  자바, 알집 , 노트패드 ,크롬  이 끝일겁니다.. 
어느날은 2틀에한번 어느날은 하루에한번 어느날은 하루에도 몇번씩 이렇게 불안정하게 꺼지니.. 참 막막합니다
          
김황중 2016-07
과거 글들을 보니.....
전기 품질도 의심되니 UPS 사용을 추천드립니다.

잘 아시겠지만
서버 꺼지는것은 정상이 아닙니다.

중고 쓰지 마시고
엔지니어의 지원을 받을수 있는 신품 사용을 권장 드립니다.
               
클래식 2016-07
아참 저희집 엘레베이터가 있는데 공용전기로 엘레베이터가 돌아가요 근데
 CCTV 리피터로 모니터 돌리는데 엘레베이터 움직일때마다 모니터가 꺼졋다 켜졋다하면서 고장이좀 났어요
그런거 보면 전기품질도 중요하단걸 배웠어요 ㅋ
그래서 한달전에 저도 창고에 ups도입했다는 ㅎㅎ
클래식 2016-07
저도 얼마전에 똑같은 문제가 있었는데
저같은 경우에는 파워가 문제드라구요
진짜 문제 찾지못해서 컴터 부술려다가 제가 예전에 누나한테도 준컴이 서버컴이라서 거기서 파워하나떄서 테스트해보니 잘됬어요
그래서 문제있는 파워는 as보내서 교환받았더라는;
     
Lucyed 2016-07
기존컴에도 파워가 문제인거같아서 파워를 하나 주문시켜서 장착후 두개로돌려봤는데  꺼지고 기존껄빼고 새로온것으로 돌려봣는데도 꺼지더라구요
김윤술 2016-07
41 Kernel-power 는 더티 셧다운입니다. 즉 어플리케이션이랑은 관련없다는 말이죠.
어플리케이션 리부팅은 덤프가 떨어지게 되어 있습니다. 전원문제인지 메모리 불량문제인지는 확인해봐야 합니다.
하드웨어적인 이슈이니 그쪽으로 원인을 발견해야됩니다.델은 펌웨어 이슈가 거이 없는데 펌웨어도 확인해 봐야되고...
     
Lucyed 2016-07
네네 감사합니다..
다른집으로 옮기고 os만 설치하여 방치해 둬보세요.
     
PPC허인구 2016-07
+100
     
Lucyed 2016-07
흐규 ...네
회원K 2016-07
hw log를 뽑아보기 전에는 원인을 못 찾아요.
     
김황중 2016-07
HP는 로그 뽑아봐야 아래와 같이 되어 있다에 한표....^^
Server power removed. 또는 Server power restored.

이런경우 HP서버는 AS 진행하면서 elevation 해 봐야 정확한것은 알수 있으나
HP와 Dell 두대 모두 비슷한 케이스다라는것을 가정으로 볼때
이 경우는 elevation 진행하여도 쉽게 답 나오지 않을듯 합니다.

이것이 제가 하드웨어 이슈가 아닌
자체적인 사용환경의 문제로 생각되는 이유입니다.
          
회원K 2016-07
그럼에도 확인은 해야죠^^
               
김황중 2016-07
그럼 여기서 영업 하나....~~^^

HP 워런티도 팔아용~~~헤헤
(참고로 당근... 워런티 비용은 서버보다 많이 나옵니다. 대신 elevation 진행 가능하도록 도와 드립니다....^^)
     
Lucyed 2016-07
로그를 어떻게해야뽑을수있을까요 os는 윈도우서버2012 r2입니다
          
회원K 2016-07
서버 hw 매뉴얼을 보세요.
장비별로 다릅니다.
          
김황중 2016-07
OS에 hp 매니지먼트 프로그램을 설치후 확인하거나
PSP 돌리셔서 IML로그(예전 오류기록) 확인후
diagnostic에서 현재상태를 확인해보시면되나
처음 사용하시는 분들은 무슨 얘긴지 이해 못하실꺼에요
여가시간 2016-07
https://support.microsoft.com/ko-kr/kb/2028504
관련 이슈가 보입니다. 잘 읽어 보시면 도움이 될 듯 합니다.

* 참고사항 *
서버의 파워가 2개라면 2개 모두 파워 케이블을 꼽고 사용해보세요.
     
Lucyed 2016-07
2개다 꼽았네요 주소 잘확인해보겠습니다
상석하대 2016-07
그 정도라면 Windows 폴더 안에 MEMORY.DMP 라는 파일이 생깁니다.
windbg로 열면 어디서 말썽이 났는지 찾을 수 있습니다.
하드웨어든 소프트웨어던 문제가 생겼던 메모리 구간이 특정되기 때문입니다.
분석하는 게 어렵게 느낄 수 있으나 검색에서 도움을 받아 차근차근 해보기 바랍니다.


QnA
제목Page 2337/5728
2014-05   5257456   정은준1
2015-12   1782272   백메가
2016-07   3944   정희섭
2016-07   5826   총각
2016-07   3723   라이젠
2016-07   10357   제행무상
2016-07   4408   NickName123
2016-07   7089   미수맨
2016-07   5805   회로쟁이
2016-07   18319   goodsense
2016-07   5933   차넷컴퓨터
2016-07   4176   anh
2016-07   4081   AplPEC
2016-07   7538   예관신규식
2016-07   10460   Lucyed
2016-07   6479   불꽃막대
2016-07   4533   AplPEC
2016-07   4634   시냇물
2016-07   4840   이니이니
2016-07   4808   서울사람
2016-07   4082   박견1
2016-07   4066   수원서식