RTX 3080 의 HPCG cuda BMT :: 2cpu, 지름이 시작되는 곳!

쓰기

[ETC] RTX 3080 의 HPCG cuda BMT

TubeAmp

06-13

2024-06-13 23:11:40

조회 11920 추천 0

간단한 내용과 함께 BMT결과화면을 캡쳐하셔서 업로드 하시면 됩니다.

(SPEC Viewpert/Vray Rendering / HD Tune / HD Tach / CINEBENCH / CrystalDiskMark / IOMeter / AJA / 소비전력)

HPCG 프로그램은 슈퍼컴퓨터 벤치마크 프로그램으로 사용되며 메모리 대역폭에 의존하여 성능이 큰 영향을 받습니다. 즉, 메모리 대역폭이 클수록 연산 능력은 더 향상 됩니다.

제가 만든 듀얼 에픽 7551 연산컴은 CPU당 메모리 채널이 8채널로 듀얼인 경우 16채널 메모리가 됩니다. DDR4 2666V 메모리를 사용했지만 stream 벤치마크를 돌려보면 280 GB/s 정도의 메모리 대역을 보여 줍니다. 메모리 대역 성능은 거의 100퍼센타일에 가까운 성능 이기에 CPU 성능은 낮지만 HPCG 벤치마크 성능은 잘 나옵니다.

RTX 3080은 10GB의 메모리에 메모리 대역폭이 760GB/s 이기에 CPU에 비해 아주 우수한 HPCG 연산 능력을 보여줄 수 있습니다. RTX 3080 이 3080Ti 나 3090에 비해 메모리 대역폭은 떨어지지만 HPCG 프로그램이 우수한 scalability 를 보여 주기에 RTX 3080 4개를 이용하여 연산 능력의 성능 향상 정도를 측정해 보았습니다.

측정 결과 RTX 3080 4개는 A100 40GB 2개에 비해 더 우수한 성능을 보여 주었습니다( 504.5 GFlop/s vs 485.0 GFlop/s).

RTX 3080 의 딥러닝 연산 능력이 부족하기는 하나 과학적 연산 프로그램을 돌리는데 잘 활용될 수 있다고 생각합니다.

시스템 사양은 아래와 같습니다.

1. CPU : i9-10900X

2. MB : Gigabyte X299 WU8

3. RAM : Samsung 16GB DDR4 3200MHz * 8 128Gbytes

4. Storage : Samsung 980 Pro 1TB

5. CPU cooler : Thermalight Peerless Assassin 120

6. Graphic cards : RTX3080 4 EAs

7. Power : EVGA 2000W

8. OS : Ubuntu 22.04

9. Benchmark software : HPCG 3.1 Binary for NVIDIA GPUs Including Ampere based on CUDA 11 xhpcg-3.1_cuda-11_ompi-4.0_sm_60_sm70_sm80

X=256, Y=256, Z=256 60 초간 벤치마크 프로그램 실행 조건으로 테스트를 진행하였습니다.

참고로 A100 40GB 2 개 HPCG 벤치마크 결과는 아래 그래프와 같습니다.

출처 : Outstanding Performance of NVIDIA A100 PCIe on HPL, HPL-AI, HPCG Benchmarks | Puget Systems

스스로 만들자.



프른하늘 07-17 오.. 단순히 A100 2개보다는 3080 4개가 더 좋다고 판단해도 되는 자료인가요? 오.. 단순히 A100 2개보다는 3080 4개가 더 좋다고 판단해도 되는 자료인가요?



TubeAmp 07-17 딥러닝이 아닌 HPCG 프로그램 같은 연산에만 그렇습니다. 딥러닝이 아닌 HPCG 프로그램 같은 연산에만 그렇습니다.

로그인 하시면 댓글을 남길 수 있습니다

쓰기

BMT

쓰기

1/55

번호	제목Page 1/55	글쓴이	날짜	조회	추천
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (228)	백메가	2015-12	1479299	25
(광고) 단통법 시대의 인터넷가입 가이드(… (228) 2015-12 1479299 1 백메가
	[필독] 처음 오시는 분을 위한 안내 (726)	정은준1	2014-05	4942482	0
[필독] 처음 오시는 분을 위한 안내 (726) 2014-05 4942482 1 정은준1
1087	(CINEBENCH) [R23][R15] Xeon Gold 6138 Dual (2)	꿀벌l최인혁	10-22	578	0
(CINEBENCH) [R23][R15] Xeon Gold 6138 Dual (2) 10-22 578 1 꿀벌l최인혁
1086	(CINEBENCH) [R23] Xeon Silver 4110 Dual	꿀벌l최인혁	10-20	606	0
(CINEBENCH) [R23] Xeon Silver 4110 Dual 10-20 606 1 꿀벌l최인혁
1085	(CrystalDiskMark) JEYI 4배속 + M.2 NVME	뚜뚜김대원	10-16	782	0
(CrystalDiskMark) JEYI 4배속 + M.2 NVME 10-16 782 1 뚜뚜김대원
1084	(ETC) 애플 M1 아이맥을 위한 20 Gbps 고속 네트워크 구축기 ( feat. 오리코 40Gbps 외장 … (9)	TubeAmp	09-13	2227	1
(ETC) 애플 M1 아이맥을 위한 20 Gbps 고속 네트… (9) 09-13 2227 1 TubeAmp
1083	(CINEBENCH) E5-2667 V4	꿀벌l최인혁	08-30	3196	0
(CINEBENCH) E5-2667 V4 08-30 3196 1 꿀벌l최인혁
1082	(CINEBENCH) [R23] AMD Ryzen 5 8600G (1)	꿀벌l최인혁	08-26	3869	0
(CINEBENCH) [R23] AMD Ryzen 5 8600G (1) 08-26 3869 1 꿀벌l최인혁
1081	(ETC) [3DMARK] AMD Ryzen 5 8600G Finalstrike Score	꿀벌l최인혁	08-26	3473	0
(ETC) [3DMARK] AMD Ryzen 5 8600G Finalstrike … 08-26 3473 1 꿀벌l최인혁
1080	(CrystalDiskMark) Hagibis 2230 Enclosure + SN740 1TB 2230 (USB 3.2 Gen1 Type-C) (4)	꿀벌l최인혁	08-07	6135	0
(CrystalDiskMark) Hagibis 2230 Enclosure + SN740 1TB 2230… (4) 08-07 6135 1 꿀벌l최인혁
1079	(ETC) ATTO Disk Benchmark -- 삼성 NVME SSD 980 PRO 1TB-- Orico M.2 NVME SSD 외장 인… (1)	TubeAmp	08-06	6454	0
(ETC) ATTO Disk Benchmark -- 삼성 NVME SSD 9… (1) 08-06 6454 1 TubeAmp
1078	(CrystalDiskMark) 알리익스프레스 N100 CPU 및 메인 보드의 나스 구축 및 성능 평가 (1)	TubeAmp	07-09	10724	1
(CrystalDiskMark) 알리익스프레스 N100 CPU 및 메인 보드의 … (1) 07-09 10724 1 TubeAmp
1077	(CINEBENCH) 맥북프로 M3 MAX 시네벤치 2024	올빼미잠와	06-27	9928	0
(CINEBENCH) 맥북프로 M3 MAX 시네벤치 2024 06-27 9928 1 올빼미잠와
1076	(ETC) RTX 3080 의 HPCG cuda BMT (2)	TubeAmp	06-13	11921	0
(ETC) RTX 3080 의 HPCG cuda BMT (2) 06-13 11921 1 TubeAmp
1075	(CINEBENCH) Dell Precision 5860 벤치마크	딸긔꼬마	06-13	11895	0
(CINEBENCH) Dell Precision 5860 벤치마크 06-13 11895 1 딸긔꼬마
1074	(ETC) 100Gb/s 인피니 밴드로 연결된 2노드 연산 클러스터에서의 HPCG 벤치마크 결과 (1)	TubeAmp	06-02	11130	0
(ETC) 100Gb/s 인피니 밴드로 연결된 2노드 연… (1) 06-02 11130 1 TubeAmp
1073	(소비전력) Ryzen 7 5700X3D 전력 다이어트 결과 (8)	dateno1	05-23	14084	0
(소비전력) Ryzen 7 5700X3D 전력 다이어트 결과 (8) 05-23 14084 1 dateno1
1072	(ETC) 100Gb/s 인피니 밴드 IB 링크 네트워크 대역 테스트	TubeAmp	05-15	9551	0
(ETC) 100Gb/s 인피니 밴드 IB 링크 네트워크 대… 05-15 9551 1 TubeAmp
1071	(ETC) 100GbE 인피니 밴드 이더넷 링크 네트워크 대역 테스트 (7)	TubeAmp	05-02	8624	0
(ETC) 100GbE 인피니 밴드 이더넷 링크 네트워크… (7) 05-02 8624 1 TubeAmp
1070	(CINEBENCH) 시네벤치(r23) i5-12600 (4)	맑은부철	05-01	6489	0
(CINEBENCH) 시네벤치(r23) i5-12600 (4) 05-01 6489 1 맑은부철
1069	(ETC) Geenbench> Ryzen 9 7945HX (1)	사누스	04-20	7106	0
(ETC) Geenbench> Ryzen 9 7945HX (1) 04-20 7106 1 사누스
1068	(CrystalDiskMark) 커세어 MP700 PRO M.2 NVMe 2TB PCIE GEN5X4 NVME	05	04-04	6756	0
(CrystalDiskMark) 커세어 MP700 PRO M.2 NVMe 2TB PCIE GEN5… 04-04 6756 1 05