|
(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234) |
백메가 |
2015-12 |
1781928 |
25 |
2015-12
1781928
1 백메가
|
|
[필독] 처음 오시는 분을 위한 안내 (737) |
정은준1 |
2014-05 |
5257061 |
0 |
2014-05
5257061
1 정은준1
|
102256 |
보조전원 필요없는 VGA 중 가장 쓸만한 것은? (12) |
악마라네 |
2016-09 |
6026 |
0 |
2016-09
6026
1 악마라네
|
102255 |
E5-2620 V3 가 저렴한 이유가 궁금합니다.. (10) |
수퍼싸이언 |
2020-02 |
14318 |
0 |
2020-02
14318
1 수퍼싸이언
|
102254 |
노트븍 호환 시피유 (5) |
푸른하늘아래 |
2018-12 |
3043 |
0 |
2018-12
3043
1 푸른하늘아래
|
102253 |
i5-6500 vs N100 (20) |
rpki |
2024-09 |
2577 |
0 |
2024-09
2577
1 rpki
|
102252 |
혹시 미니드릴 쓰시는분 있으신지요 (8) |
가빠로구나 |
2015-08 |
4913 |
0 |
2015-08
4913
1 가빠로구나
|
102251 |
서버램 질문좀 하겠습니다. (5) |
크리보 |
2020-02 |
2663 |
0 |
2020-02
2663
1 크리보
|
102250 |
델 옵티플렉스 윈7프로 64비트 설치 이미지 구합니다. (1) |
이원재K |
2014-04 |
3731 |
0 |
2014-04
3731
1 이원재K
|
102249 |
ssd에 전기가 흘러 자꾸 쇼트가 나는데 해결법 있을까요? (14) |
병따개님 |
2020-02 |
5205 |
0 |
2020-02
5205
1 병따개님
|
102248 |
파티션 매직이나 윈도우 설치할때 볼수 있는 unallocated 영역은 무엇일까요??? (2) |
병맛폰 |
2012-05 |
5575 |
0 |
2012-05
5575
1 병맛폰
|
102247 |
시놀로지 NAS 공유폴더 볼륨 변경 관련 문의 (2) |
L2스위치 |
2024-10 |
898 |
0 |
2024-10
898
1 L2스위치
|
102246 |
2tb hdd 추천부탁드립니다. (9) |
윤치열 |
2012-05 |
6928 |
0 |
2012-05
6928
1 윤치열
|
102245 |
gen8 옥탑방 usb로 연결해도 되나요? (2) |
킵고잉 |
2016-09 |
4450 |
0 |
2016-09
4450
1 킵고잉
|
102244 |
Xeon 일반 케이스 (ATX규격 / 좀 작은) 추천 바랍니다. (4) |
안성현 |
2015-09 |
4312 |
0 |
2015-09
4312
1 안성현
|
102243 |
centos 6 에서도 빠른 포맷 가능한가요? (5) |
jake |
2015-09 |
7637 |
0 |
2015-09
7637
1 jake
|
102242 |
삼성 G43M02S1 마더보드 바이오스를 찾습니다.. |
박문형 |
2024-10 |
898 |
0 |
2024-10
898
1 박문형
|
102241 |
선배 고수님들께 RAID관련 문의 좀 드리겠습니다 (10) |
엄청난x |
2012-06 |
5371 |
0 |
2012-06
5371
1 엄청난x
|
102240 |
뮤패드10.1 or 늑대와여우 10.1 태블릿 사용하시는분께 질문드립니다. (2) |
거니네 |
2015-09 |
8023 |
0 |
2015-09
8023
1 거니네
|
102239 |
한 컴퓨터에서 가상 ip 를 수백개 만들수도 있는지요 (1) |
가빠로구나 |
2014-05 |
3911 |
0 |
2014-05
3911
1 가빠로구나
|
102238 |
현재 신품 USB FDD 와 신품 플로피디스켓을 구할 방법이 있을까요? (18) |
차넷컴퓨터 |
2019-01 |
4188 |
0 |
2019-01
4188
1 차넷컴퓨터
|
102237 |
아수스 공유기 TM-AC1900 (RT-AC68U) 인터넷이 자꾸 끊깁니다 ㅠㅠ (4) |
반성만 |
2021-06 |
4670 |
0 |
2021-06
4670
1 반성만
|
게임에도 쓰이고 다른 잡일에도 범용적으로 쓰일 수 있는 보편적 기본 연산 성능이 이정도다... 정도로 이해하시면 됩니다.
차량용 엔진의 '출력' 정도로 포괄적인 스펙이죠...
Max simultaneous displays 라는 스펙은4x 4096 x 2160 @ 120 Hz, / 4x 5120 x 2880 @ 60 Hz, / 2x 7680 x 4320 @ 60 Hz
로 되어있는데 중간은 해상도고 뒤는 주사율인데 앞에 4x는 해당 해상도와 주사율로는 4개의 디스플레이를 동시에 지원한다
라고 봐도 되는걸까요?
1초에 최대 FP32연산을 38.7 테라 번 연산이 가능한 거죠.
다만 이것도 한계가 있어서 마구잡이로 처리 가능한 값의 범위를 늘리기는 어려운데, 단정밀을 기준으로 이 처리 범위를 거의 두 배로 늘려 잡는 것이 배정밀, 그의 절반 정도로 줄이는 것이 반정밀입니다. 3D 작업에서 게임같은 부분은 좀 연산이 부정확하더라도 크게 문제는 없기에 단정밀, 아예 반정밀까지 내리더라도 큰 문제는 없고 이렇게 연산의 정밀도와 한계를 줄여서 처리 효율을 높입니다. 반대로 딥러닝같은 부분에서는 매우 정확한 연산이 필요하기에 배정밀 수치가 중요해집니다.
다만 전반적으로 요즘의 그래픽 프로세서의 추세는 단정밀 성능에 올인하고 배정밀, 심지어 반정밀 성능도 어느 정도 무시하는 설계를 하고 있습니다. 이는 배정밀이 필요한 작업을 텐서 코어같은 별도의 회로에 의존하도록 분업을 한 결과이기도 합니다. 예를 들어 지포스 30 시리즈(암페어 아키텍처)의 경우 배정밀 성능은 단정밀 성능의 1/64에 불과하고, 심지어 반정밀 성능이 단정밀과 같아지고 있습니다. AMD도 전체적인 추세는 비슷하긴 한데 그래도 여기는 RDNA2를 기준으로 1/16 수준을 유지하고 있습니다.
GPU에서의 배정밀도 연산은 주로 시뮬레이션 워크로드에 사용됩니다.
TF, BF, FP 연산들로 나뉘는 matrix 자료가 있었는데 찾아보려니 안 보이네요.
비전공자 입장에서 많이 헷갈리긴 합니다.
https://blogs.nvidia.com/wp-content/uploads/2020/05/tf32-Mantissa-chart-hi-res-FINAL.png.webp
각 옵션간 속도차이는 여기 table 2
https://developer.nvidia.com/blog/nvidia-ampere-architecture-in-depth/