[질문] DELL R740XD + RTX2080Ti 11G 2EA 세팅시 문제점

   조회 8609   추천 0    

안녕하세요.

DELL R740XD + RTX2080Ti 11G 2EA 중

DELL R740XD 는 PSU 를 1100W 로 2개다 교체한 상태이고, 2080TI 는 오늘 오전에 구입한겁니당.


[상태]

1. 모든 펌웨어는 다 올린 상태

2. HGST 1.6TB x 12EA SAS SSD Read 1100M / Write 700M / 12개

3. H740p 8G

4. RTX2080Ti 2개

5. 파워 1100W X 2개


학습된 데이터를 최대한 빨리쓰는 머신으로 세팅 중입니다. 

RTX 2080TI 는 DELL 인증은 아닙니다.


1) 질문

idrac dashboard 에 

A fatal error was detected on a component at bus 175 device 0 function 2.

A fatal error was detected on a component at bus 59 device 0 function 2.

이런 메세지가 올라와서요

부팅시는 안올라오는데, 가끔 저 메세지가 올라옵니다.

RTX2080Ti 관련된거 같습니다만..........


2) 질문

PCIe NVME 는 슬롯 여유가 없어서 못꼽음 / GPU 2개 + PCIe Raid 1개
12G SAS SSD 다수로 최대 읽기 속도,쓰기를 하고 싶습니다 , ( RAID 0 X )

:) FIO 에서 3,200M ~ 3,500M /S 나오는데, 이정도면 빠른건가요....?

서버 / 파트 / 워크스테이션 / 서비스 / IDC / 개발 01088434673 / saleserver@naver.com
짧은글 일수록 신중하게.
죠슈아 2020-06
사용중인 OS 가 윈도우이면  아래 링크에서 설명하는 방법으로
BUS 175와 BUS 59가 어떤 것인지 확인 하실 수 있을 겁니다.

https://www.dell.com/support/article/en-us/sln78547/how-to-identify-faulty-part-when-facing-bus-device-function-error?lang=en
https://www.experts-exchange.com/questions/29011130/How-to-identify-component-causing-bus-fatal-error-on-Dell-PowerEdge-T110.html

이 두가지가 RTX2080Ti 라고 의심 된다면
이 카드를 제거한 상태에서 해당 오류 메시지가 계속 되는지 확인 하는 것도 도움이 될 것입니다.
     
SugarCube 2020-06
항상 감사합니다!!!!!
황진우 2020-06
CPU 모델이 어떻게 되나요?..
     
SugarCube 2020-06
SILVER 4116T 입니다!
     
SugarCube 2020-06
TSR LOG 올렸습니당!!!!
          
황진우 2020-06
cmos 에서 PCI 확장 슬롯 사용 여부를 확인 해보시지요..

장치가 있는데 인식못하는경우 보다는 없는곳에 있다고 해놓아서 나온 메세지 같습니다.
반대일수도 있고요..
8 BUS 가 조금 걸리기는 합니다만..
시피유 이슈가 있나 싶어서 물어 본것입니다.

번호가 낮은 버스는 시피유 관리 목록일경우가 많습니다.

보드불량?...
박문형 2020-06
대략 보았을때 스토리지쪽으로 장비 스팩상으로는 거의 최대로 올린 듯합니다..

백플레인도 12G SAS EXPANDER를 사용한 듯합니다..

레이드 묶을때 스트라이프 사이즈를 조절해서 속도 튜닝을 하는 정도가 다일 듯합니다..

기본이 얼마인지 모르겠지만 256K 512K 1M 중 묶었을때 속도가 재일 빠른 것을 선택하면 됩니다..

단 테스트 할려면 시간을 많이 소모하겠네요..
     
SugarCube 2020-06
블럭 사이즈는 1M / 고객이 데이타 크기가 저정도 단위 된다고 해서요 그렇게 했습니다.

조언 감사합니다! :) 더 빠르게 IO 하고 싶습니다!
SugarCube 2020-07
ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ 미션완료 ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ
오핫핫 2020-11
안녕하세요. 저도 동일한 증상이있는데요
DELLEMC R740서버이고 GPU RTX2080Ti 1ea쓰고있습니다.
a fatal error was detected on a component at bus 175 device 0 function 2
에러가 찍히고 PCI 경고등이 들어오는데 혹시 어떻게 해결하셨나요??
델에서 TSR LOG 분석 해주나요??
저도 인증내에 있는데 글픽카드가 델께아니라고 안해주네요;;
     
NGMAN78 2021-10
저도 동일한 증상을 경험중인데...혹시 해결하셨는지요?
정보공유 부탁드립니다.


QnA
제목Page 1018/5727
2015-12   1775945   백메가
2014-05   5250836   정은준1
2020-07   4566   캡틴아메리카노
2020-07   4637   삐돌이슬픔이
2020-07   3112   gjh7
2020-07   3491   Psychophysi…
2020-07   5527   홀릭0o0
2020-06   16987   냐미냐미
2020-06   4177   SugarCube
2020-06   3706   아뽀리
2020-06   4300   병맛폰
2020-06   4930   딩규
2020-06   8610   SugarCube
2020-06   3840   까치산개꿀탱
2020-06   3686   봉래
2020-06   6544   서울I김동수
2020-06   4769   정의석
2020-06   3240   강한구
2020-06   3466   사랑하라
2020-06   4476   프틸롭시스
2020-06   3454   새로운차원
2020-06   6563   수퍼싸이언