요즘 GPU서버 때문에 이것 저것 알아보고있습니다.
고수님들의 도움 부탁드립니다.
1. V100 이 현재 완전 하이엔드 모델인것 같은데 맞는지와 P6와의 성능차이가 얼마나 나는지 알고 싶습니다.
2.V100 스펙을 보면
Double-Precision Performance : 7TFLOPS
Single-Precision Performance : 14TFLOPS
Tensor-Precision Performance : 112TFLOPS
이게 무슨뜻이고 왜 차이가 나는지 궁굼합니다.
3. 타입을 보니 MXM, SXM2 이렇게 있던대 이것도 무슨차이인지 궁궁합니다.
GPU 고수님들의 도움 부탁드립니다.
즐거운 저녁 되세욤~~
Double-Precision Performance : 7TFLOPS
Single-Precision Performance : 14TFLOPS
Tensor-Precision Performance : 112TFLOPS
°¢°¢ ¹èÁ¤¹Ðµµ ´ÜÁ¤¹Ðµµ, ÅÙ¼Á¤¹Ðµµ ¿¬»ê ¼Óµµ°í, ¹èÁ¤¹Ðµµ´Â 2¹èÀÇ Á¤¹Ðµµ·Î °è»êÇÏ´Â °Å´Ï ´ÜÁ¤¹ÐµµÀÇ 1/2 ÆÛÆ÷¸Õ½º°¡ ³ª¿À´Â°Ô Áö±ØÈ÷ ´ç¿¬ÇÕ´Ï´Ù. ¶ÇÇÑ Tensor-Precision Àº GPU¿¡ º°µµ·Î Á¸Àç ÇÏ´Â Tensor Core °¡ ´ã´çÇؼ ¼Óµµ°¡ ´Ù¸£°Ô ³ª¿É´Ï´Ù.
Tesla V100 ÀÇ °æ¿ì ÀÎÅÍÆäÀ̽º°¡ PCI-Ex 16¹è¼Ó°ú NVlink ¹æ½ÄÀÇ ÀÎÅÍÆäÀ̽º°¡ ÀÖ½À´Ï´Ù.
Tesla P6 ´Â ÆĽºÄ® ¾ÆÅ°ÅØó·Î ¸¸µé¾îÁø ÀÌÀü¼¼´ë Å×½½¶óÀÔ´Ï´Ù. ÆĽºÄ® º£À̽ºÀÇ Å×½½¶óÀÇ °æ¿ì P100ÀÌ °¡Àå ÇÏÀÌ¿£µå ¹öÁ¯À̸ç, ÀÌ ¸ðµ¨ÀÌ Å×½½¶ó V100°ú ºñ±³ÇÒ¸¸ÇÑ GPU¶ó°í »ý°¢Àº µË´Ï´Ù.
ÇöÇàÀº º¼Å¸ ¾ÆÅ°ÅØóÀÇ Å×½½¶ó V100ÀÌ °¡Àå ³ªÀº ¼±ÅÃÀ̱ä Çѵ¥, À̰͵µ ÀÌÁ¨ °ÅÀÇ ³¡¹°À̱ä ÇÑ°Å °°³×¿ä.
p6 ´Â mxm ±×·¯´Ï±î ³ëÆ®ºÏ ÀÎÅÍÆäÀ̽º ÇüÅ·Π³ª¿À´Â ¸ð¾çÀÔ´Ï´Ù
p6 ¼º´ÉÀº
Double-Precision Performance : 192.8 GFLOPS
Single-Precision Performance : 6169 GFLOPS
v100 ÇÏ°í´Â ¼º´ÉÂ÷ÀÌ°¡ »ó´çÇϳ׿ä
¾Æ½Ã°ÚÁö¸¸ 1000GFLOPS = 1TFLOPS ÀÔ´Ï´Ù
p6 ebay¿¡ 6450ºÒ¿¡ ³ª¿ÍÀÖ½À´Ï´Ù??? ¹¹ ÀÌ·¸°Ô ºñ½ÎÁö???
Tesla P100
µÎ°³¸¦ ºñ±³Çϼ¼¿ä.. À§ µÎ Á¦Ç°µµ Â÷ÀÌ°¡ ¸¹ÀÌ ³³´Ï´Ù..
ÇϹ°¸ç P6 ´Â ºñ±³µµ ¾ÊµÇ°ÚÁÒ..
Processor SMs CUDA Tensor Frequency (double) (single) (Tensor) Cache Memory B/W
P100 PCIe 56 3,584 N/A 1.126 GHz 4.7Tf 9.3Tf 18.7 16 GB 720 GB/s
V100 PCIe 80 5,120 640 1.53 GHz 7.0Tf 14.0Tf 112 16 GB 900 GB/s
https://www.xcelerit.com/computing-benchmarks/insights/benchmarks-deep-learning-nvidia-p100-vs-v100-gpu/
https://videocardz.com/newz/nvidia-announces-a100-pcie-accelerator
´ñ±Û º¸°í Á»´õ ã¾Æº¸´Ï ÆĽºÄ® º¼Å¸ ¾ÏÆä¾î ¼øÀÌ°í ¾Õ±ÛÀÚ µû¼ P100 V100 A100 ÀÌ·¸°Ô °¡³ªº¾´Ï´Ù.
A100Àº Àü¼¼´ë V100 º¸´Ù 30%Á¤µµ ¼º´ÉÇâ»óÀÎ°Í °°°í¿è.
±×¸®°í ÅÙ¼Äھ ÀÖ¾î¼ TPU¶ó°íµµ ºÎ¸£³ª º¸³»¿ä.