µö·¯´×¿¡¼­ mGPU»ç¿ë¹æ¹ý¿¡ ´ëÇÑ Áú¹®ÀÔ´Ï´Ù~!

cpu2kyu   
   Á¶È¸ 2312   Ãßõ 0    

http://www.2cpu.co.kr/deep/1674 (352)
https://www.tensorflow.org/guide/distributed_training?hl=ko (919)

"이전에 딥러닝 게시판에 올렸지만 게시판 성격이 안맞는것 같아서 옮겼습니다"

--------------------------------------------------------------------------------------------------------------

안녕하세요~!
딥러닝 업무를 받게되면서 컴퓨터를 맞추기 위해서 하드웨어를 공부중인데 2장의 GPU의 VRAM을 사용하는 방법이 궁금합니다


CUDA나 텐서플로우가 mGPU를 지원한다고 하는데 정녕 자동으로 VRAM을 나눠서 작업을 해주진 않을거라 추측되서 찾아보니 아래같은 내용이 있었습니다.

이런 분산 Strategy을 설정해서 사용하면 될것 같은데 그럼 텐서플로우에서 갖고있는 자원 내에서 알아서 정리가 되는건가요??
보통 n-way로 딥러닝 워크스테이션 맞추시는 분들은 대부분 이런 전략을 사용하거나 수동으로 GPU에 일을 할당하시나요?


3090 2-way로 견적을 맞출 예정인데 2개의 VRAM과 GPU를 사용하려면 그에 맞는 코딩을 하는게 맞는건지
아니면 신경 안써도 자동으로 2대를 다 사용해주는건지 궁금합니다.
(어차피 SLI이나 CFX는 VRAM 간의 대역폭을 넓혀주는데 도움은 줄 수 있을것 같은데 크게 신경쓰고 있진 않습니다...)


마지막으로 제가 시스템을 구축하면 다른 개발자들이 그 위에서 코딩을 할것 같은데 백엔드는 nvcc 같은걸로 연결해놓고
그 위에 텐서플로우의 distribute 설정된layer을 올릴 수 있을까요?? 개발자들이 distribute관련된 지식없이 텐서플로우 예제만 따라쳐도 알아서 분산처리될 수 있는 환경을 구축할 수 있는지 궁금합니다.

ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
ÀÌÁØ¿ë 2020-10
¾Æ¸¶ °¡Àå ½¬¿î ¹æ¹ýÀº nvlink¾Æ´Ò±î »ý°¢µË´Ï´Ù.
3090nvlink Áö¿øÇϳª¿ä.?
     
cpu2kyu 2020-10
3090¿¡ nvlink Á¦°øÇÏ°í ÀÖ½À´Ï´Ù!
GPU ¿©·¯°³ ²ÅÇôÀÖ´Â°É º¼ ¶§´Â ¸ÚÀÖ¾ú´Âµ¥ ½ÇÁ¦·Î ¾µ·Á´Ï Çè³­Çϳ׿ä;;

nvlinkÀ» ¿¬°á½ÃÅ°¸é ÅÙ¼­ÇÃ·Î¿ì »ó¿¡¼­µµ ºÐ»ê󸮸¦ ¾ÈÇصµ µÇ³ª¿ä???
nvlink´Â sli¿Í °°Àº ±â´ÉÀ¸·Î µ¥ÀÌÅÍ ¹ö½ºÁ¤µµ·Î¸¸ ÀÌÇØÇÏ°í ÀÖ¾ú½À´Ï´Ù
(GPU 1¹ø¿¡¼­ °è»êµÈ °á°ú¸¦ GPU 2¹øÀ¸·Î ¸ðÀ» ¶§ ºü¸¥ µ¥ÀÌÅÍ Àü¼ÛÀÌ °¡´ÉÇÏ´Ù Á¤µµ·Î »ý°¢ÇÏ°í ÀÖ¾ú½À´Ï´Ù)
¼ºÈÆ 2020-10
data parallel °ú model parallelÀ» ¼±ÅÃÇÏ¼Å¾ß ÇÒ°ÍÀÔ´Ï´Ù.

data parallelÀº GPU¸¶´Ù µ¿ÀÏÇÑ ³×Æ®¿öÅ©¸¦ ¿Ã¸°µÚ 1¹ø µ¥ÀÌÅÍ¿¡ ´ëÇÑ ¿¬»êÀº 1¹ø gpu¿¡¼­ 2¹ø µ¥ÀÌÅÍ¿¡ ´ëÇÑ ¿¬»êÀº 2¹øÀ¸·Î ¼öÇàÇÏ´Â ¹æ¹ýÀ̸ç,

model parallelÀº ¾î¶² ¿¬»êÀº 1¹ø gpu¿¡¼­ ³ª¸ÓÁö ¿¬»êÀº 2¹ø gpu¿¡¼­ ¼öÇàÇÏ´Â ¹æ¹ýÀÔ´Ï´Ù.

1¹øÀº data parallel wrapper¸¦ ¸ðµ¨¿¡ ¾º¿öÁֱ⸸ ÇÏ¸é ±¸ÇöÀÌ ½±°Ô µÇÁö¸¸, model parallelÀº ¼¼ºÎÀûÀ¸·Î Á÷Á¢ device¿¡ ´ëÇؼ­ ¿¬»êÀ» ÁöÁ¤ÇØÁÖ¾î ±¸ÇöÇÏ¿©¾ß ÇÕ´Ï´Ù.

Áö½Ä¾øÀÌ ÇÏ·Á¸é data parallelÂÊÀ¸·Î °í·ÁÇϽðí, data paralle ¿¹Á¦´Â ¸¹ÀÌ °ø°³µÇ¾î ÀÖÀ¸´Ï Âü°íÇÏ½Ã¸é µÉ°Í °°½À´Ï´Ù.
     
cpu2kyu 2020-10
¼¼ºÎÀûÀÎ Á¤º¸ °¨»çµå¸³´Ï´Ù~!
óÀ½ ½ÃÀÛÀÌ´Ï data parallelºÎÅÍ ½ÃÀÛÇؼ­ ±¸Á¶°¡ Àͼ÷ÇØÁö¸é model parallel·Î ³Ñ¾î°¡¾ß°Ú½À´Ï´Ù¤Ð

GPU Àß ¾²·Á¸é ¾öû ±í°Ô ³»·Á°¡¾ß°Ú¾î¿ä¤Ð¤Ð


QnA
Á¦¸ñPage 849/5681
2014-05   4949458   Á¤ÀºÁØ1
2015-12   1486167   ¹é¸Þ°¡
2020-11   2909   comduck
2020-11   3675   Goldstars
2020-11   3056   ¹Ú¹®Çü
2020-11   2787   ¸¶»ê½Ã¹Î
2020-11   2416   Ãֽÿµ
2020-11   3340   ¼úÀÌ
2020-11   3325   ¸¸»ç¿ÀÄÉÀÌ
2020-11   2444   Áý±¸¼®
2020-11   2348   HyperLapse
2020-11   3917   ¶Ñ¶Ñ±è´ë¿ø
2020-11   3182   µðÁöÀ¯
2020-11   3166   ºí·ç¿µ»ó
2020-11   3225   GPGPU
2020-11   2395   ½ÅÀº¿Ö
2020-11   2571   ºÒŸ´Â¾¦´ë¹ç
2020-11   4189   ¾îÄg
2020-11   2732   hyunwoo3480
2020-11   3129   inquisitive
2020-11   2747   ½ºÄµl¹ÎÇö±â
2020-11   3981   2CPUÃÖÁÖÈñ