ESXI + 패스스루한 GPU로는 병렬처리가 불가능한가요?

sam0712   
   조회 1819   추천 0    

안녕하세요?

최근에 ESXI를 구축하고 특정 가상환경에 GPU를 2대 패스스루 해두었습니다.

딥러닝도좀 할겸 사용을좀 해보고있었는데요


이상하게 GPU1 번으로 학습하던 도중 GPU2에 특정 업무를 할당하니까 GPU1이 멈춥니다.(죽지는 않습니다.)

이후 GPU2에 할당된 업무가 끝나면 GPU1이 다시 동작하기 시작합니다.


관련된 이슈를 찾아보려해도 뭔가 잘 안나와서 질문드려봅니다.

ESXI에 gpu를 2대 패스스루하면 원래 병렬처리가 안되는걸까요??

짧은글 일수록 신중하게.
sam0712 2024-03
좀 더 찾아보니 다들 된다는것 같네요.. 다른문제인가봅니다.. 연구해보겠습니다.
제온프로 2024-03
가장 중요한 것은 메인보드 인데..정보가 없네요..
가상화지원 PCIe : SR-IOV 설정이 되어 있나 보세요..
델서버나 HP 서버는 기본값이 Enable 인데요..

ESXi support for Intel iGPU with SR-IOV
https://williamlam.com/2023/11/esxi-support-for-intel-igpu-with-sr-iov.html
     
sam0712 2024-03
패스스루를 끄고 SR-iOV로 가상장치화 한다음 사용해보라는 말씀이신것이죠~?
          
송주환 2024-03
NVAIE 라이센스를 구매했다면 맞는 말이지만, 아니라면 그렇지 않아요
               
sam0712 2024-03
NVAIE라이센스라 하심은 vGPU용 라이센스를 말씀하시는게 맞으실까요?
                    
송주환 2024-03
NVAIE와 vGPU는 서로 다른 라이센스입니다. Compute Profile을 사용하려면 NVAIE를 구매해야 합니다.
dateno1 2024-03
딱히 큰 문제 없었습니다

게스트 입장에선 그냥 그래픽이 2개 있는것뿐입니다
     
sam0712 2024-03
그럴거같은데 왜 자꾸 동시에 일하라고하면 한명이 싫다고 안하고있을까요ㅠㅠ
트니아빠 2024-03
멈춘다는 것은 처리 속도가 현저하게 늦어진다는 것일까요?
특정 업무가 무엇인지는 모르지만, 병목 현상을 일으킬만한 무엇인가 있지 않을까요?
     
sam0712 2024-03
아예 처리가 멈추는듯 합니다.
딥러닝 학습을 진행시킬때 model A를 gpu1번에, model B를 gpu2번에 학습을 시킨다 하면, gpu1에서 잘 학습되던것이 gpu2가 학습을 시작한시점부터 학습을 종료할때까지 아예 돌아가지 않습니다. (사용율 0%)
동일한 코드를 esxi가아닌 일반 pc에서 돌리는경우 문제없이 두대의 gpu에서 잘 동작하기 때문에 코드문제는 아니지않을까 싶습니다.
vram 이 16gb 넘어가나요? 그러면 별도로 세팅해줘야 하는것들이 있습니다.
https://octo.vmware.com/enable-compute-accelerators-vsphere-6-5-machine-learning-hpc-workloads/
덤으로 반드시 uefi부팅 설정도 되어있어야 합니다.
     
sam0712 2024-03
답글 감사합니다. 해당설정을 하지않는경우 GPU를 사용할수가없어서 모두 해둔상태입니다!
민호양 2024-03
nvlink나 nvswitch말하시는거 아니겠지요? 단순히 2개인데 안돈다는건가요? 각각 python process를 할당하면 두개는 독립적으로는 도나요?


QnA
제목Page 161/5724
2015-12   1761927   백메가
2014-05   5235740   정은준1
2024-03   1723   기억을머금…
2024-03   1700   dateno1
2024-03   1820   sam0712
2024-03   2356   NiteFlite9
2024-03   1775   정은준1
2024-03   1295   나로와
2024-03   4029   제로원소프트
2024-03   1597   애니악
2024-03   2230   천번둥개
2024-03   3102   블루영상
2024-03   2523   시도니
2024-03   2920   래넌
2024-03   1607   막울었어요
2024-03   2455   뱅그니
2024-03   1945   몰라맨
2024-03   2642   이창준
2024-03   1704   광주동키호테
2024-03   2795   신우섭
2024-03   1692   90kong
2024-03   1903   꾸띠웍