안녕하세요. 공과대학에서 박사학위중인 학생입니다.
여러번 질문을 드린결과, 2 CPU + 2 GPU 시스템으로 워크스테이션을 구축할 예정입니다.
참고로 제가 사용하는 소프트웨어는 쓰레드 수가 많을 수록 유리하다고 알려져있습니다.
분자 시뮬레이션을 진행중이며 N x N body interaction 계산을 많이 수행해야합니다.
진짜 컴알못이라 며칠째 고민중이라 질문 드립니다.
본 질문
왜 CPU 속도의 증가폭에 비해 시뮬레이션 소프트웨어의 속도는 비례하지 않는가?
아래 그래프는 CPU의 성능 차이에 따른 분자시뮬레이션 소프트웨어의 성능 비교 그래프입니다.
Sisosoftware 사이트에서는 CPU간 속도의 차이를 볼 수 있었습니다. (From Processor Arithmetic)
그래프를 보시면 2697 v3 < 2697 v4 < 6148 로 갈수록 Perfomance가 1 < 1.29 < 2.01 로 증가하는 것을 볼 수 있습니다.
하지만, 2697 v3 대비 Gold 6148이 Average score는 1.5배 증가해도 성능 자체는 2배이상 향상된 것을 볼 수 있었습니다.
Versus 사이트에서 Xeon 2697 v4와 Xeon Gold 6148을 비교하였을 때는 CPU 속도차이보다는
L2 CACHE 수치가 GOLD 6148 (빨간색이) 월등이 크다는 것만 알 수 있었습니다.
그래서 유추상으로는 L2 CACHE가 중요하구나 정도만 알았습니다.
추가적인 설명해주실분 있으시면 굉장히 감사하겠습니다.
(https://versus.com/en/intel-xeon-e5-2697-v4-vs-intel-xeon-gold-6148)
Intel Xeon E5-2697 v3
https://ark.intel.com/ko/products/81059/Intel-Xeon-Processor-E5-2697-v3-35M-Cache-2-60-GHz-
Intel Xeon E5-2697 v4
https://ark.intel.com/ko/products/91755/Intel-Xeon-Processor-E5-2697-v4-45M-Cache-2-30-GHz-
Intel Xeon Gold 6148
https://ark.intel.com/products/120489/Intel-Xeon-Gold-6148-Processor-27-5M-Cache-2-40-GHz-
¾Ú¹ö, °¡¿ì½Ã¾È µî ¿äÁò ´ëºÎºÐ ÇÁ·Î±×·¥µéÀº GPU °¡¼ÓÀ» »ç¿ëÇÕ´Ï´Ù. (CPU º¸´Ù GPU°¡ Áß¿äÇÕ´Ï´Ù)
±×¸®°í CPU¿¡¼ ÇϳªÀÇ ¼ýÀÚ¸¦ °¡Áö°í 1Â÷¿øÀûÀΠôµµ·Î ¼º´ÉÀ» Á¤È®ÇÏ°Ô ³ªÅ¸³¾ ¹æ¹ýÀº ¾ø½À´Ï´Ù.
ij½Ã¿Í °°Àº ¸¶ÀÌÅ©·Î¾ÆÅ°ÅØÃÄ ºÎÅÍ ISA, Ŭ·° µîµî ¼ö ¸¹Àº ºñ¼±ÇüÀûÀÎ ¿ä¼ÒµéÀ» °í·ÁÇØ¾ß Çϱ⠶§¹®ÀÔ´Ï´Ù
Á¤È®ÇÑ ºñ±³´Â ¾î¶°ÇÑ ¿öÅ©·Îµå°¡ ÁÖ¾îÁ³À»¶§, ±×°ÍÀ» ¼öÇàÇϴµ¥ ¾ó¸¶³ª ½Ã°£ÀÌ ¼Ò¿äµÇ´À³Ä? <- ÀÌ·¸°Ô¹Û¿¡ ºñ±³ÇÒ ¼ö ¾ø½À´Ï´Ù
½Ì±Û°ú ¸ÖƼ¼º´ÉÀÇ ±¸ºÐÀº Á¦ °æ¿ì¿¡´Â ±ãº¥Ä¡¸¦ ¸¹ÀÌ ÂüÁ¶Çϴµ¥, E5-2697 v3°ú v4´Â ÄÚ¾î¼ö´Â v4°¡ 4°³ ¸¹Áö¸¸ Ŭ·°Àº ¿ÀÈ÷·Á ³·¾ÆÁ³±â ¶§¹®¿¡
v4°¡ ½Ì±Û°ú ¸ÖƼ°¡ ¿ÀÈ÷·Á v3º¸´Ù ¶³¾îÁö´Â°É·Î ³ª¿É´Ï´Ù. ¹°·Ð ±ãº¥Ä¡¿¡¼ »ç¿ëÇÏ´Â ¸î¸î °è»ê ¾Ë°í¸®ÁòµéÀÌ »ç¿ëÇϽô ¾îÇÃÀÇ ¿¬»ê°ú ´Ù¸£°í
´Ù¸¥ º¥Ä¡¿Íµµ ´Ù¸£±â ¶§¹®¿¡ »ó´ëÀûÀ¸·Î Âü°í¸¸ ÇÕ´Ï´Ù¸¸, ¿©Æ° v3°ú v4¿¡´Â ¼º´ÉÂ÷ÀÌ°¡ °ÅÀÇ ¾ø´Ù°í º¸°í, ´Ù¸¸ Gold 6148·Î´Â 21%~24% ¼º´ÉÀÌ
Áõ°¡ÇÑ°É·Î È®Àεdz׿ä. À§ ±×·¡ÇÁÀÇ 2¹è¸¦ ÀÎÁ¤ÇÑ´Ù¸é ±ãº¥Ä¡¿¡¼ÀÇ Çâ»óÄ¡º¸´Ù ´õ È¿À²ÀÌ ÁÁÀº°Í °°³×¿ä.
CPU¸ðµ¨¸í (Ŭ·°, ÄÚ¾î¼ö) ±ãº¥Ä¡ ½Ì±Û ¸ÖƼ
-----------------------------------------------------------------
E5-2697 v3 (2.6G, 14core) ½Ì±Û 3553 ¸ÖƼ 29713
E5-2697 v4 (2.3G, 18core) ½Ì±Û 3421 ¸ÖƼ 28001
Gold 6148 (2.4G, 20core) ½Ì±Û 4158 ¸ÖƼ 34868
E5-2697 v4¿¡¼ Gold 6148ÀÇ ¼º´ÉÇâ»óÄ¡ ½Ì±Û 21% ¸ÖƼ 24%
±ãº¥Ä¡ ÇÁ·Î¼¼½º º¥Ä¡¸¶Å© http://browser.geekbench.com/processor-benchmarks
±ãº¥Ä¡ 6148 ½Ì±Û ¹× ¸ÖƼ º¥Ä¡¸¶Å© http://browser.geekbench.com/v4/cpu/search?page=2&q=6148&utf8=%E2%9C%93
Á¦¿Â E5-2600 V4 ¾¾¸®Áî ¿Í ½ºÄÉÀÏ·¯ºí Á¦¿ÂÀº Å©±âµµ ¿ÏÀüÈ÷ ´Ù¸£°í ¾È¿¡ Çϵå¿þ¾î ¸í·É¾îµµ ´Ù¸£¸ç ¸ðµç°Ô ´Ù ´Ù¸¨´Ï´Ù..
½ºÄÉÀÏ·¯ºí Á¦¿ÂÀÌ ÇöÀç ÀçÀÏ ¸¶Áö¸·¿¡ ³ª¿Â Á¦¿ÂÀÌ°í Ŭ·°º¸´Ù´Â ÄÚ¾î °¹¼ö¿¡ Ä¡ÁߵǸç ÀÌ¿¡ µû¶ó °¡»óÈ °°Àº°Í¿¡ »ç¿ëµÈ´Ù°í ºÁ¾ß ÇÕ´Ï´Ù..
½ºÄÉÀÏ·¯ºí Ç÷¹Æ¼³Ñµµ Àִµ¥ ´ë·« ¸ðµ¨¿¡ µû¶ó °³´ç 1500-2000¸¸¿øÂë ÇÕ´Ï´Ù..
½ºÄÉÀÏ·¯ºí °ñµå´Â ´Ù³ª¿Í¿¡¼ ³ª¿Â °¡°ÝÀ¸·Î´Â 600-700¸¸¿ø¶§°¡ °¡Àå ³ôÀ» °ÍÀÔ´Ï´Ù..
www.cpu-world.com ¿¡¼ ÇÊ¿äÇϽŠÇÁ·Î¼¼¼¸¦ ºñ±³ÇϽøé Á»´õ ÀÚ¼¼ÇÑ Á¤º¸°¡ ³ª¿É´Ï´Ù..
±×¸®°í DP ¶§ ÆÛÆ÷¸Õ½º Â÷ÀÌ ºñ±³ °°Àº °ÍÀº ÀÎÅÚ ±â¼úºÎ³ª ¾ÆÅ°ÅÃÃÄ ¹Ú»ç±Þ¿¡°Ô ¹®ÀÇÇØ¾ß ÇÒ Áú¹®À¸·Î º¸À̳׿ä..
µµ¿òÁ» µå¸±±î °Ë»öÁ» ÇغýÀ´Ï´Ù..
º¸Åë ¸ÖƼ ¾²·¹µå Áö¿øÇÏ´Â ÇÁ·Î±×·¥Àº ´Ü¼øÇÏ°Ô .. Ŭ·° * ÄÚ¾î¼ö Çϼż ºñ±³ ÇÏ½Ã¸é °ÅÀÇ º¥Ä¡¶û
¸Â¾Æ ¶³¾îÁý´Ï´Ù.. ÇÏÁö¸¸.. cpu ¼¼´ë°¡ °°À»¶§ À̾߱â°í .. ¼¼´ë°¡ ³ô¾ÆÁú¼ö·Ï °°Àº Ŭ·°¿¡¼
¼º´ÉÇâ»óÀÌ ÀÖÀ¸´Ï ±×°É °¨¾È ÇÏ½Ã¸é µÉ°Í °°½À´Ï´Ù.. ¸»¾¸ÇϽŵ¥·Î.. 1.5¹è Â÷ÀÌÀε¥ º¥Ä¡»ó¿¡¼
2¹è Á¤µµ ¼º´É Â÷ÀÌ°¡ ³ª´Â°Ç.. ij½Ã ¶§¹®Àº ¾Æ´Ñ°Å °°½À´Ï´Ù. 6148 Á¦Ç°¿¡ º¸½Ã¸é
Intel¢ç AVX-512 ¸¦ Áö¿øÇÑ´Ù°í ³ª¿ÍÀÖ°í ÀÎÅÚ¿¡¼ Àú ÇÁ·Î±×·¥°ú avx-512ÀÇ ±×·¡ÇÁ¸¦ °¡Áö°í È«º¸ÇÏ°í ÀÖ°í
ftp://ftp.gromacs.org/manual/manual-2019-rc1.pdf °¡Àå ÃÖ±Ù ¸Þ´º¾ó¿¡ ¿É¼Ç »çÇ׿¡ º¸¸é
avx-512°ü·Ã ¿É¼ÇÀÌ Àִ°ɷΠº¸ÀÔ´Ï´Ù.. cpu ÀÇ ¸í·É¼ÂÀ» È°¿ëÇÏ¸é ±× ±â´É¿¡¼
¼ö¹è ¼ö½Ê¹è°¡ ºü¸£°Ô µ¿ÀÛ Çϴ°ɷΠ¾Ë°í ÀÖ½À´Ï´Ù.. ±×·¡¼ Àú·± Â÷ÀÌ°¡ ³ª´Â°É·Î »ý°¢µË´Ï´Ù.
https://www.techpowerup.com/img/MAC0FcfwI0cO8pTQ.jpg ¾îµð ÀÚ·áÀÎÁø ¸ð¸£Áö¸¸ ÀÌ·± ±×·¡ÇÁµµ Àֳ׿ä
±×·¡¼ Á¦ »ý°¢Àº.. ¸¸¾à »ç¿ë ÇÏ°í °è½Ã´Â ÇÁ·Î±×·¥ÀÌ Àú ÇÁ·Î±×·¥À̰ųª AVX-512¸¦ Áö¿øÇϸé Àú°Í°ú À¯»çÇÑ
°á°ú°¡ ³ª¿Ã°ÍÀÌ°í AVX-512¸¦ Áö¿øÇÏÁö ¾Ê´Â ÇÁ·Î±×·¥À̶ó¸é Àú ±×·¡ÇÁ´Â ¾Æ¹« ÀÇ¹Ì ¾ø¾îÁö°í ..
1.5 ¹è¸é.. 1.5¿¡ ÁØÇÏ´Â ±×·¡ÇÁ°¡ ³ª¿Ã²¨¶ó°í »ý°¢ÇÕ´Ï´Ù.
ºñ°ü·ÃÀÚÀÌ´Ï.. ±×³É ÂüÁ¶¸¸ ÇØÁÖ¼¼¿ä.
gromacs »çÀÌÆ®¿¡ °¡º¸¸é
Added AVX-512F SIMD support
This adds cpuid detection for AVX-512F and the low-level SIMD implementation. It is not yet present in any shipping hardware, but the knights landing version of Intel MIC will be the first CPU to support it, as well as future generations of their normal x86 CPUs (i.e., it merges MIC and x86 SIMD). The implementation currently only works with icc, and passes unit tests in the Intel SDE emulator. Some kernel kernel support functions are not yet implemented, and the instruction set will not be enabled automatically yet.
ÀÌ·¸°Ô ³ª¿ÍÀÖ½À´Ï´Ù. À§¿¡ ¸®ÇÃ´Ü PDF¿¡ 512 È°¼ºÈ ÇÏ´Â ¿É¼Çµµ ÀÖ±¸¿ä .
AVX-512F ÇØÅÃÀÎ °Í °°½À´Ï´Ù.
ÀÎÅÚ Advanced Vector Extensions 512( AVX-512) °³¿ä
±î´Ù·Î¿î ¿öÅ©·Îµå¸¦ À§ÇÑ ¼º´É Çâ»ó
ÀÎÅÚ¢ç AVX-512´Â °úÇÐ ½Ã¹Ä·¹À̼Ç, ±ÝÀ¶ ºÐ¼®, Àΰø Áö´É(AI)/µö ·¯´×, 3D ¸ðµ¨¸µ ¹× ºÐ¼®, À̹ÌÁö ¹× ¿Àµð¿À/ºñµð¿À ÇÁ·Î¼¼½Ì, ¾ÏÈ£È, µ¥ÀÌÅÍ ¾ÐÃà µîÀÇ ¿öÅ©·Îµå¿Í ¿ëµµ¸¦ À§ÇØ ¼º´ÉÀ» °¡¼ÓÈÇÒ ¼ö ÀÖ´Â »õ·Î¿î ¸í·É ÁýÇÕÀÔ´Ï´Ù.
Çâ»óµÈ º¤ÅÍ ÇÁ·Î¼¼½Ì ±â´É
Ãʱ¤´ë¿ª 512ºñÆ® º¤ÅÍ ¿î¿µ ±â´ÉÀ» °®Ãá ÀÎÅÚ¢ç AVX-512´Â °¡Àå ±î´Ù·Î¿î ÄÄÇ»Æà ÀÛ¾÷µµ ¹®Á¦ ¾øÀÌ Ã³¸®ÇÒ ¼ö ÀÖ½À´Ï´Ù.
¾ÖÇø®ÄÉÀ̼ÇÀº 512ºñÆ® º¤ÅÍ ³»¿¡¼ ÇÑ Å¬·Ï Áֱ⿡ ÃÊ´ç 32°³ ¹èÁ¤¹Ðµµ ¹× 64°³ ´ÜÁ¤¹ÐµµÀÇ ºÎµ¿ ¼Ò¼öÁ¡ ¿¬»êÀ» ó¸®ÇÒ ¼ö ÀÖÀ¸¸ç, 8°³ÀÇ 64ºñÆ® ¹× 16°³ÀÇ 32ºñÆ® Á¤¼ö¿Í ÃÖ´ë 2°³ÀÇ 512ºñÆ® FMA(Fused-Multiply Add) À¯´ÖÀ» Æ÷ÇÔÇÒ ¼ö ÀÖ½À´Ï´Ù. µû¶ó¼, ÀÌ°ÍÀº ÀÎÅÚ¢ç Advanced Vector Extensions 2.0(ÀÎÅÚ¢ç AVX2)°ú ºñ±³ÇßÀ» ¶§ µ¥ÀÌÅÍ ·¹Áö½ºÅÍ ÆøÀÌ 2¹è, ·¹Áö½ºÅÍ ¼ö°¡ 2¹è, FMA À¯´Ö ÆøÀÌ 2¹è¿¡ ÇØ´çÇÕ´Ï´Ù.
±×·¡¼ ÃÖ»óÀÇ È¿À² ³»·Á¸é °è»ê ÁøÇàÇϽǶ§ 1CPU ÄÚ¾î¼ö¸¸ÅÀÇ ¾²·¹µå·Î µ¹¸®´Â°Ô Á¦ÀÏ ÁÁÀ»°Ì´Ï´Ù.