|
[필독] 처음 오시는 분을 위한 안내 (736) |
정은준1 |
2014-05 |
5208785 |
0 |
2014-05
5208785
1 정은준1
|
|
(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234) |
백메가 |
2015-12 |
1740469 |
25 |
2015-12
1740469
1 백메가
|
103870 |
M72e 바이오스 업데이트 방법 문의 드립니다. (2) |
이순신 |
2022-04 |
2346 |
0 |
2022-04
2346
1 이순신
|
103869 |
아 나도 sns맹인듯 ㅠㅠ 이거 어찌 차단하쥬? (4) |
쌍cpu |
2023-09 |
2346 |
0 |
2023-09
2346
1 쌍cpu
|
103868 |
갤럭시탭 ,아이패드 ,아이패드미니...정밀그림그리는용도 (8) |
slowcity |
2022-04 |
2346 |
0 |
2022-04
2346
1 slowcity
|
103867 |
도메인으로 들어올시 지정된 포트로 전달할려면 어디서 설정하나요? (6) |
네이스터 |
2020-06 |
2347 |
0 |
2020-06
2347
1 네이스터
|
103866 |
AMD FirePro W4100 성능 문의드려봅니다 (14) |
VSPress |
2021-10 |
2347 |
0 |
2021-10
2347
1 VSPress
|
103865 |
윈도우즈 10 이미지 복구 성공 (4) |
박문형 |
2022-11 |
2347 |
0 |
2022-11
2347
1 박문형
|
103864 |
아래 하단에 툴바처럼 광고가 뜨는데 왜 그럴까요? (5) |
가온누리I강… |
2023-05 |
2347 |
0 |
2023-05
2347
1 가온누리I강…
|
103863 |
이 케이블이 크로바 케이블인가요? (5) |
검은콩 |
2023-09 |
2347 |
0 |
2023-09
2347
1 검은콩
|
103862 |
스피커를 블루투스 TWS 스피커로 만들어 줄 수 있는 모듈이 있을까요? (8) |
tuffguy7 |
2023-10 |
2347 |
0 |
2023-10
2347
1 tuffguy7
|
103861 |
IBM 1723-8bx 18.5" 콘솔모니터 사이드레일 브라켓 문의 드립니다. |
슬루프 |
2022-12 |
2347 |
0 |
2022-12
2347
1 슬루프
|
103860 |
Windows 10 XBox 게임 삭제 ? (12) |
화란 |
2022-11 |
2347 |
0 |
2022-11
2347
1 화란
|
103859 |
[질문] CISCO NEXUS HDMI CABLE ? 콘솔케이블? (1) |
SugarCube |
2020-07 |
2347 |
0 |
2020-07
2347
1 SugarCube
|
103858 |
[Linux] 왜 Cached 가 없어지질 않을까요? (15) |
찬이 |
2023-01 |
2347 |
0 |
2023-01
2347
1 찬이
|
103857 |
랙 서버 (1) |
컴퓨터하나… |
2020-11 |
2348 |
0 |
2020-11
2348
1 컴퓨터하나…
|
103856 |
서버랙만 매입하는 업체가 있나요? (8) |
도오 |
2022-02 |
2348 |
0 |
2022-02
2348
1 도오
|
103855 |
서버실 LCD KVM 혹은 노트북 테이블 구매 문의 드립니다. (2) |
삼돌군 |
2021-07 |
2348 |
0 |
2021-07
2348
1 삼돌군
|
103854 |
말씀대로 diskmgmt.msc로 봤는데요 (1) |
쿵짝쿵짝 |
2020-02 |
2348 |
0 |
2020-02
2348
1 쿵짝쿵짝
|
103853 |
OS 부팅 디스크로 Optane P5800X를 쓸 경우 단일 드라이브 or 레이드 어떤게 좋을까… (16) |
농부76 |
2023-06 |
2348 |
0 |
2023-06
2348
1 농부76
|
103852 |
헤놀에 nfs 연결 가능한가요? |
임진욱 |
2019-01 |
2348 |
0 |
2019-01
2348
1 임진욱
|
103851 |
멍청한 질문하나 드려보고자 합니다. HBA완전 기초 (4) |
다이어트중 |
2022-04 |
2348 |
0 |
2022-04
2348
1 다이어트중
|
참고: https://www.nvidia.com/en-us/data-center/tensor-cores/#end-to-end
float은 자료형이고 (tf32도 float에 해당) flops는 연산속도입니다. float 연산을 1초에 몇 번 할 수 있느냐.. 보통 이론상 최대 수치를 적어두죠. tf32 tflops라고 적어뒀다면 tf32를 썼을 때의 최대 flops 속도겠지요. (테라 단위)
2.
int는 그냥 정수형이라는 뜻입니다. 실수 표현 못하고 정수값만 표현할 수 있는 자료형.. 딥러닝이나 신호처리에서 쓰긴 좀 까다롭지만 잘 쓰면 float계열 대비 연산속도가 빠르죠.. 딥러닝쪽에선 보통 고속 인퍼런스 목적으로만 씁니다.
죄송한데 제가 지금 데이터시트를 만들고있는데요
peak TF32 Tensor TFLOPS 는 ampere이전에것은 다 없는게맞는건가요? 튜링 볼타도 텐서가있다고 계산법대로 작성하라는데..
peak FP32 tensor TFLOPS (non-tensor) 이게 근데 논텐서인데 맞는말인가요? FP32 텐서플롭을 구하라는데..
논텐서는 CUDA코어 FP32 (IEEE754 single-precision) 기준 TFLOPS 적으라는 뜻 같습니다. 텐서라는 단어는 왜 들어갔나 모르곘는데 뭐 텐서연산시 기준으로 하라는 거 아닐까요? 피크값이라니 그냥 스펙시트에 적힌 CUDA코어 32비트 tflops값 쓰셔도 될 것 같습니다. 의존성 적은 단순한 텐서 연산이라면 쿠다 코어 이론상 성능을 거의 그대로 낼 수 있으니...
FP32 성능 * SM당 TensorCore 개수 * Tensor 버전 성능 * 2(sparsity)
SM당 TensorCore 수 (gv100 8개 , ga100 4개)
Tensor 버전별 성능 차이 ( ampere 에서 사용한 3세대 Tensor Core는
Volta와 Turing 에 사용한 Tensor Core 1, 2 세대 보다 2배 좋은 성능을 가졌음 )
sparsity 원리로 최대 2배 성능
이걸가지고 TF32를 볼타부터 구하라는데 저는 데이터시트를 찾아봐도 ampere만 TF32가 있는걸봐서 안적고있었거든요
그럼 TF32는 ampere부터인게 맞는거같은데...
혹시 GA100 102 104 106 / GP100 104 107 이런식으로 100시리즈에서 점점 늘어나던데
이건 제조과정에서 100프로 성능이 못나와서 하위버전으로 나오는게 맞나요?
볼타/튜링의 "쿠다코어" 는 32비트 연산이 되는데, 말씀하시는 분이 그것때문에 착각하고 계신게 아닌가 하는 생각이 드네요.. 아니면 그 텐서코어가 최종 연산결과를 FP32로 누적시켜서 FP32로 반환하게 만들 수 있기는 한데, 그것때문에 착각하셨거나요. 내부적으로 FP32 연산 구간이 있다곤 해도 사용자가 32비트 데이터를 입력시킬 수 있는 게 아니고 내부적인 동작, 그 중에서도 특정 단계에만 일시적으로 쓰는 수준이기 때문에 학술적인 용도로 뭐 텐서코어를 세부적으로 분석하는 경우라던가 그런 거라면 몰라도 데이터시트에 32비트 tflops 성능이라고 적어도 될 만한 것은 아닙니다.
GA100 102 그건 저도 정확히 알고 있지는 않은데, 기본적으론 아예 따로 제조되는 칩으로 알고 있습니다. 같은 번호내에서 (예를 들어 GA100 내에서) 성능이나 커팅 여부 등을 기준으로 더 세세하게 모델을 분류하기는 할 겁니다. 근데 뭐 모델 이름 붙이는건 엔비디아 맘대로라서..? 제가 잘 모르는 케이스가 있을지도 모르겠습니다.