|
[필독] 처음 오시는 분을 위한 안내 (734) |
정은준1 |
2014-05 |
5150453 |
0 |
2014-05
5150453
1 정은준1
|
|
(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234) |
백메가 |
2015-12 |
1684980 |
25 |
2015-12
1684980
1 백메가
|
44056 |
파워 추천 부탁 드립니다.. (3) |
차병훈 |
2005-08 |
5865 |
35 |
2005-08
5865
1 차병훈
|
44055 |
29160과 39160의 차이는? (1) |
오재호 |
2005-08 |
5865 |
14 |
2005-08
5865
1 오재호
|
44054 |
바이오스 업데이트 질문드려봅니다. (8) |
이사장 |
2013-02 |
5865 |
0 |
2013-02
5865
1 이사장
|
44053 |
T7610에서 메인 SSD 속도 향상 방법이 뭐가 있을까요? (5) |
제상현 |
2014-11 |
5865 |
0 |
2014-11
5865
1 제상현
|
44052 |
divx 압축을 하면 화질이 raw 보다 나쁜가요? (2) |
김형숙 |
2005-04 |
5865 |
3 |
2005-04
5865
1 김형숙
|
44051 |
적십자회비지로.... (9) |
김건우 |
2008-01 |
5866 |
18 |
2008-01
5866
1 김건우
|
44050 |
바탕화면 FPS표시 (1) |
AplPEC |
2016-05 |
5866 |
0 |
2016-05
5866
1 AplPEC
|
44049 |
Hyper-V 라이센스 질문(Windows Server 2019 standard) (5) |
오핫핫 |
2021-05 |
5866 |
0 |
2021-05
5866
1 오핫핫
|
44048 |
하드 조합 문의입니다 |
정혜진 |
2006-05 |
5866 |
29 |
2006-05
5866
1 정혜진
|
44047 |
제온 e5450 스테핑 차이가? (3) |
정현옥 |
2015-03 |
5866 |
0 |
2015-03
5866
1 정현옥
|
44046 |
바이오스 업데이트 때문에 질문 드립니다. (3) |
최민철 |
2005-07 |
5866 |
20 |
2005-07
5866
1 최민철
|
44045 |
어이없는 트러블입니다. 2cpu회원님들 좀 도와주세요! ㅠ.ㅠ (22) |
이태호 |
2006-03 |
5866 |
28 |
2006-03
5866
1 이태호
|
44044 |
XP64에서 윈도우 글자 크기 조절 (1) |
박준용 |
2007-05 |
5866 |
4 |
2007-05
5866
1 박준용
|
44043 |
네트워크렌더링에 관하여 질문을 드립니다.. |
박이준 |
2005-06 |
5866 |
46 |
2005-06
5866
1 박이준
|
44042 |
소 (3) |
왕용필 |
2011-10 |
5866 |
0 |
2011-10
5866
1 왕용필
|
44041 |
사타2 대역폭 질문드립니다. (8) |
곽선호 |
2006-06 |
5866 |
10 |
2006-06
5866
1 곽선호
|
44040 |
하드 가격이 많이 올라서 SSD 로 가려면 어떤 모델이 좋을까요? (3) |
김준유 |
2011-11 |
5866 |
0 |
2011-11
5866
1 김준유
|
44039 |
저렴한 스토리지형 오실로스코프 구입 방법.. |
심규상 |
2008-06 |
5866 |
23 |
2008-06
5866
1 심규상
|
44038 |
저번에 1080ti sli 병목관련으로 질문했던 중생입니다. (2) |
유포리아 |
2017-05 |
5867 |
1 |
2017-05
5867
1 유포리아
|
44037 |
혹시 레드헷3 gcc2.3버전과 glibe2.3.2 rpm을 다운받을수있는 사이트없을까요 (1) |
정영철 |
2008-04 |
5867 |
10 |
2008-04
5867
1 정영철
|
굳이 업글할 이유 없이 아직 그냥 쓰는 사람들이 많아서 어쩔 수 없습니다.
스케일은 가격이 넘사벽이고 x99가 아직은 제일 많이사용하니깐 가격도 세고 물량도없죠~
그런데 x10d계열 듀얼보드도 가격은 별 차이는 안나는 게 함정입니다;;;;
중고 시세는 c612보드 중에서도 슈마가 싼편이긴 합니다. ASUS같은 건 c612듀얼로 대략 중고보드만 40만원가까이 하더라고요
벤치상 VGA 성능차이가 거의 안난다고들 하지만 막상 써보면 차이가 좀 나거든요.
예를들어 1080ti의 경우 GPU<->GDDR사이의 bandwidth는 리퍼런스 기준으로 11GBps인데요, PCIe 3.0 x8의 bandwidth는 7880MB/s, GBps로 환산하면 63GBps나 됩니다. 즉 비디오 메모리에 CPU가 텍스처 데이터(보통 게임에서 비디오 메모리의 80% 이상은 텍스처입니다)를 밀어주고 GPU가 이 데이터들로 렌더링을 하고 있을 때 GPU기준에서 버퍼 언더플로우가 날 확률(GPU측에서 비디오메모리에 원하는 렌더링 데이터가 아직 도착하지 않은 경우)은 프로그래머가 렌더러를 개판으로 짜지 않는 이상 별로 없다고 생각합니다. 또한 요즘의 하이엔드 비디오 카드들을 이용한 렌더러 추세는 멀티코어도 적극적으로 활용해 가면서 최대한 로딩이나 유휴시간에 비디오 메모리에 텍스처를 밀어넣고, 가급적 렌더링 중 비디오 메모리의 데이터를 flush하는 것을 막는 쪽으로 개발되고 있습니다. 사실 예전에 비디오 메모리가 적었을 땐 텍스처 로딩 전략을 잘 짜는 것도 최적화의 요소였는데 요즘은 그냥 로딩할때 대 때려놓고 씬 끝날때까지 안 내립니다. vram양만 받쳐 준다면 그쪽이 더 짜기 쉽고 프레임에도 유리하죠. 셰이더 코어에도 친화적인 전략이고 결정적으로 멀티스레드 렌더링을 걸기 쉽습니다.
예전에는 DrwaPrimitive API를 호출(즉 진짜로 프레임 버퍼에 그려라! 하고 CPU가 명령을 내리는 순간) 에 매 프리미티브마다 바꿔 줘야 할 셰이더 상수들도 제법 있었고 애시당초 DX9까지는 비디오메모리에 다 때려박고 CPU는 다른거 하러 가는 식으로 짜기가 매우 힘들었습니다. 편법으로 텍스처 스테이지를 이용해 8장까지 사용할 순 있지만, 일단 샘플러 스테이지 스테이트 같은 걸 사용해야 하는 경우도 있고요(대표적인 케이스가 노멀 매핑) 그래서 큰 텍스처 한 장을 만들어서 이 텍스처를 공유하고 UV만 각자 알아서 오려가는 형태로 프로그램을 짜 줘야 핬는데(이걸 텍스처 아틀라싱이라고 합니다) 결정적으로 DX9 시절에선 텍스처 사이즈가 4k x 4k여서 들어가는 텍스처의 용량 자체가 크지 않았거든요. (정확하게 말하면 DX가 제약을 건 게 아니라 DXCaps로 보는 GPU에서 제약이 있었는데, 4k넘어가는 텍스처를 지원하는 GPU가 당시에 없었던 걸로 기억합니다.) 여튼 이때는 VRAM도 쪼그만했고 그걸 사용하기도 쉽지 않았는데, 요즘은 뭐 세상 좋아졌죠... 비디오 메모리만 허락하면 다 때려박고 절대로 VRAM안내리고 걍 dp dP DP만 하면 됩니다 ㅎㅎ
여튼 그래서 예전에 실수(?)로 x8속도로 비디오 카드 굴리면서 개발한 적이 있었는데요 제가 했던 일이 렌더링 최적화쪽 일이 많아서 프로파일러 자주 돌렸었거든요. 나중에 실수한걸 알고 X16으로 돌렸는데... 진짜 병아리 눈물만큼 올라가더군요. 대략 5퍼센트 정도였던 것 같은데... 이건 대역폭 자체보다는, 같은 버스 클럭속도라고 해도 대역폭이 넓으면 그만큼 레이턴시가 좀이라도 올라가는데 이 영향이라고 생각합니다. (물론 대역폭이 X8을 넘기지 않는다는 가정 하에서 입니다)
제 견해는 이렇습니다만, 제가 뭐 렌더러의 신도 아니고 차이가 날 경우도 있을 순 있을겁니다.
게임에서 5% 성능하락은 그래픽카드 가격이 몇십만원 왔다갔다 할수 있습니다.
말씀하신 작업부분만 컴퓨터의 용도가 아니죠.
그리고 성능향상 이런 부분은 어떻게 보면 굉장히 민감한 분야입니다. PCIe 레이턴시에 의해 성능이 차이가 많이 난다면 프로파일링으로 된 데이터가 증거로서 필요하다고 봅니다. 프로파일러가 중요한 이유는, 게임의 프레임 레이트란 게 워낙 여러 가지 요소의 영향을 받기 때문에 개발 중 프로그래머는 프레임이 개판으로 나오는 이유를 알아내야 그 부분의 튜닝이 가능하기 때문입니다. FPS에서 시점 휙 돌렸더니 갑자기 버버벅대서 혹시 텍스처 갈아끼는 부분의 문제인가 하고 봤더니 SSD에서 바이러스 체크 하고 있더라... 뭐 이런 허탈한 경우도 있거든요.
뭔가 더 이해하기 쉽게 쓰고 싶은데 글 재주가 없네요;;;
하지만 개발자로서의 문제가 아닌 게임 플레이어로서의 문제입니다.
게임성능 몇프레임, 3DMark 점수 몇백, 몇천점 올리기 위해 어마어마하게 투자하는 사람들 입장에서는
그 5%의 성능하락조차 용납이 안된다는 것을 말씀드리고 싶은 것입니다.
https://www.gamersnexus.net/guides/2488-pci-e-3-x8-vs-x16-performance-impact-on-gpus
https://www.pugetsystems.com/labs/articles/Titan-X-Performance-PCI-E-3-0-x8-vs-x16-851/
https://www.tomshardware.com/reviews/amd-crossfire-nvidia-sli-multi-gpu,2678-5.html
어느 자료를 봐도 대략 2퍼센트 혹은 그 이하의 차이를 보이는데, 제가 5퍼센트라고 했던 것도 사실 아주 tolerance를 많이 잡은 거고, 대부분은 그것보다 훨씬 더 차이가 덜 납니다. 일부터 x16슬롯이 있는데 x8슬롯을 쓸 필요는 없겠지만요... 그리고 제가 위에 예를든 보드 전부 x16이 있습니다.
여담인데 렌더러에 대해 아시는 것도 많으신 것 같고 엔진 프로그래머의 자질이 있으신 것 같아요. 저는 사실 5퍼센트 성능 향상이 있는데 몇십만원 투자할 깡도 없고 5퍼센트 떨어진다고 용납못하는 성격도 아니긴 해요;;;;
상황자체가 그런걸 신경쓸 케이스가 아닙니다...