ESXI + Æнº½º·çÇÑ GPU·Î´Â º´·Ä󸮰¡ ºÒ°¡´ÉÇÑ°¡¿ä?

sam0712   
   Á¶È¸ 389   Ãßõ 0    

안녕하세요?

최근에 ESXI를 구축하고 특정 가상환경에 GPU를 2대 패스스루 해두었습니다.

딥러닝도좀 할겸 사용을좀 해보고있었는데요


이상하게 GPU1 번으로 학습하던 도중 GPU2에 특정 업무를 할당하니까 GPU1이 멈춥니다.(죽지는 않습니다.)

이후 GPU2에 할당된 업무가 끝나면 GPU1이 다시 동작하기 시작합니다.


관련된 이슈를 찾아보려해도 뭔가 잘 안나와서 질문드려봅니다.

ESXI에 gpu를 2대 패스스루하면 원래 병렬처리가 안되는걸까요??

ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
sam0712 03-27
Á» ´õ ã¾Æº¸´Ï ´Ùµé µÈ´Ù´Â°Í °°³×¿ä.. ´Ù¸¥¹®Á¦Àΰ¡º¾´Ï´Ù.. ¿¬±¸Çغ¸°Ú½À´Ï´Ù.
°¡Àå Áß¿äÇÑ °ÍÀº ¸ÞÀκ¸µå Àε¥..Á¤º¸°¡ ¾ø³×¿ä..
°¡»óÈ­Áö¿ø PCIe : SR-IOV ¼³Á¤ÀÌ µÇ¾î ÀÖ³ª º¸¼¼¿ä..
µ¨¼­¹ö³ª HP ¼­¹ö´Â ±âº»°ªÀÌ Enable Àä..

ESXi support for Intel iGPU with SR-IOV
https://williamlam.com/2023/11/esxi-support-for-intel-igpu-with-sr-iov.html
     
sam0712 03-27
Æнº½º·ç¸¦ ²ô°í SR-iOV·Î °¡»óÀåÄ¡È­ ÇÑ´ÙÀ½ »ç¿ëÇغ¸¶ó´Â ¸»¾¸À̽ŰÍÀÌÁÒ~?
          
NVAIE ¶óÀ̼¾½º¸¦ ±¸¸ÅÇß´Ù¸é ¸Â´Â ¸»ÀÌÁö¸¸, ¾Æ´Ï¶ó¸é ±×·¸Áö ¾Ê¾Æ¿ä
               
sam0712 03-28
NVAIE¶óÀ̼¾½º¶ó ÇϽÉÀº vGPU¿ë ¶óÀ̼¾½º¸¦ ¸»¾¸ÇÏ½Ã´Â°Ô ¸ÂÀ¸½Ç±î¿ä?
                    
NVAIE¿Í vGPU´Â ¼­·Î ´Ù¸¥ ¶óÀ̼¾½ºÀÔ´Ï´Ù. Compute ProfileÀ» »ç¿ëÇÏ·Á¸é NVAIE¸¦ ±¸¸ÅÇØ¾ß ÇÕ´Ï´Ù.
dateno1 03-27
µüÈ÷ Å« ¹®Á¦ ¾ø¾ú½À´Ï´Ù

°Ô½ºÆ® ÀÔÀå¿¡¼± ±×³É ±×·¡ÇÈÀÌ 2°³ Àִ°ͻÓÀÔ´Ï´Ù
     
sam0712 03-28
±×·²°Å°°Àºµ¥ ¿Ö ÀÚ²Ù µ¿½Ã¿¡ ÀÏÇ϶ó°íÇϸé ÇѸíÀÌ ½È´Ù°í ¾ÈÇÏ°íÀÖÀ»±î¿ä¤Ð¤Ð
¸ØÃá´Ù´Â °ÍÀº ó¸® ¼Óµµ°¡ ÇöÀúÇÏ°Ô ´Ê¾îÁø´Ù´Â °ÍÀϱî¿ä?
ƯÁ¤ ¾÷¹«°¡ ¹«¾ùÀÎÁö´Â ¸ð¸£Áö¸¸, º´¸ñ Çö»óÀ» ÀÏÀ¸Å³¸¸ÇÑ ¹«¾ùÀΰ¡ ÀÖÁö ¾ÊÀ»±î¿ä?
     
sam0712 03-28
¾Æ¿¹ 󸮰¡ ¸ØÃߴµí ÇÕ´Ï´Ù.
µö·¯´× ÇнÀÀ» ÁøÇà½Ãų¶§ model A¸¦ gpu1¹ø¿¡, model B¸¦ gpu2¹ø¿¡ ÇнÀÀ» ½ÃŲ´Ù Çϸé, gpu1¿¡¼­ Àß ÇнÀµÇ´ø°ÍÀÌ gpu2°¡ ÇнÀÀ» ½ÃÀÛÇѽÃÁ¡ºÎÅÍ ÇнÀÀ» Á¾·áÇÒ¶§±îÁö ¾Æ¿¹ µ¹¾Æ°¡Áö ¾Ê½À´Ï´Ù. (»ç¿ëÀ² 0%)
µ¿ÀÏÇÑ Äڵ带 esxi°¡¾Æ´Ñ ÀÏ¹Ý pc¿¡¼­ µ¹¸®´Â°æ¿ì ¹®Á¦¾øÀÌ µÎ´ëÀÇ gpu¿¡¼­ Àß µ¿ÀÛÇϱ⠶§¹®¿¡ Äڵ幮Á¦´Â ¾Æ´ÏÁö¾ÊÀ»±î ½Í½À´Ï´Ù.
vram ÀÌ 16gb ³Ñ¾î°¡³ª¿ä? ±×·¯¸é º°µµ·Î ¼¼ÆÃÇØÁà¾ß Çϴ°͵éÀÌ ÀÖ½À´Ï´Ù.
https://octo.vmware.com/enable-compute-accelerators-vsphere-6-5-machine-learning-hpc-workloads/
´ýÀ¸·Î ¹Ýµå½Ã uefiºÎÆà ¼³Á¤µµ µÇ¾îÀÖ¾î¾ß ÇÕ´Ï´Ù.
     
sam0712 03-28
´ä±Û °¨»çÇÕ´Ï´Ù. ÇØ´ç¼³Á¤À» ÇÏÁö¾Ê´Â°æ¿ì GPU¸¦ »ç¿ëÇÒ¼ö°¡¾ø¾î¼­ ¸ðµÎ ÇصлóÅÂÀÔ´Ï´Ù!
¹ÎÈ£¾ç 03-28
nvlink³ª nvswitch¸»ÇϽô°Š¾Æ´Ï°ÚÁö¿ä? ´Ü¼øÈ÷ 2°³Àε¥ ¾Èµ·´Ù´Â°Ç°¡¿ä? °¢°¢ python process¸¦ ÇÒ´çÇÏ¸é µÎ°³´Â µ¶¸³ÀûÀ¸·Î´Â µµ³ª¿ä?


óÀ½À¸·Î (218,627)
Á¦¸ñ
2CPU : ÆǸŠ04-25   210   ÇÁ·£µå
2CPU : ÆǸŠ04-25   239   1Çгâ3¹Ý
2CPU : ÆǸŠ04-25   200   Á¦Æ®¿¥¿¢½º
2CPU : ÆǸŠ04-25   171   Á¦Æ®¿¥¿¢½º
2CPU : ÆǸŠ04-25   77   ÇÁ·£µå
2CPU : ÀÚÀ¯°Ô½ÃÆÇ 04-25   385   piedPiper
2CPU : ÆǸŠ04-25   117   Á¦Æ®¿¥¿¢½º
2CPU : DIY-È£ÀÛÁú 04-25   517   SiCMOS
2CPU : ÆǸŠ04-25   127   ¾Èµ¿ÀǾϻìÀÚ
2CPU : ÆǸŠ04-25   226   Çã¹Ö¹öµå
2CPU : QnA 04-25   230   »ßµ¹À̽½ÇÄÀÌ
2CPU : ÆǸŠ04-25   384   1Çгâ3¹Ý
2CPU : ÆǸŠ04-25   325   1Çгâ3¹Ý
2CPU : ÀÚÀ¯°Ô½ÃÆÇ 04-25   428   gmltj
2CPU : °­Á°ԽÃÆÇ 04-25   138   ĵÀ§µå