A100 80GB SXM4 GPU W(¿ÍÆ®) ¹®ÀÇ µå¸³´Ï´Ù.

   Á¶È¸ 462   Ãßõ 0    

http://GPU (10)

안녕하세요. 고수님 문의 사항이 있어 글 올립니다. 

1. 장비명 : DELL Poweredge XE8545

2. OS : Ubuntu 22.04.5 LTS (GNU/Linux 6.8.0-48-generic x86_64)

3. GPU : 4X A100 80GB SXM4 GPU

4. 드라이브 버전 : 565.57.01 / CUDA Version : 12.7

현재 장비 사용중인 GPU의 전력은 275W로 사용중이고  전력 리미트는 최저 100W( TDP)에서 최대 275W (TDP)책정되어 있습니다.(4개 모두 동일함)





해당 GPU 확인 결과 최대 사용 가능한 전력은 500W(TDP)인데 어떻게 해야지 해당 전력을 사용할수 있는지요?

 

nvidia-smi --query-gpu=name,power.draw,power.limit --format=csv 명령어 입력 후 

sudo nvidia-smi -pl 300W로 새 전력 값을 넣었습니다. (테스트로 값을 입력함)





전력 리미트가 되어 있어

Provided power limit 300.00W is not a valid power limit which should be between 100.00W and 275.W for GPU

00000000:01.00.0 Terminatin early due to privious errors. 라는 메시지가 뜹니다. 

전력 리미트를 풀수 있는 명령어가 있는지요?

아니면 드라이브 버전 때문에 전력(TDP)가 제한되어 있는지요?


최대치 500W 까지는 사용할 수 있는지 고수님께 문의 드립니다. 


추 신 : 만약 전력 리미트를 풀고 400W~500W를 사용한다면 GPU 발열에 문제가 생길수 있는지도 같이 문의 드립니다. 


추가적으로 델 동영상을 찾아 보니 IDRAC9에서 

Power Cap Policy 정책이 저희 서버에서는 나오지 않는데 

바이오스 버전 때문에 그런것인지요?


현재 사용중인 서버의 바이오스 버전은 2.11.3 입니다.  

현재 저희 서버 상태 입니다. 




동영상 버전에는 

해당 내용과 같이 나오는데 펌웨어 문제인지 조언 부탁 드립나다. 






ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
º´Ã¶ 11-18
ÆÄ¿ö¼­ÇöóÀÌ ±¸¼ºÀÌ ¾î¶»°Ô µÇ³ª¿ä? ÅäÄ«¸·ÀÌ ÀåÂøµÇ¾î ÀÖ³ª¿ä?
ÇÑÁßÀÏ 11-18
ÆÄ¿ö¼­ÇöóÀÌ´Â 2400W * 4EA ÀåÂø µÇ¾î½À´Ï´Ù.
º´Ã¶ 11-18
½Ç¿ÂÀº ¸îµµÀΰ¡¿ä? DL380 G10 Å×½ºÆ®ÇϽô°Šº¸´Ï±î ½É»óÄ¡ ¾Ê´øµ¥.
ÇÑÁßÀÏ 11-18
IDC¿¡¼­ ¿î¿µÁßÀÌ°í IDC´Â ´ë·«ÀûÀ¸·Î 24~25µµ·Î ¿î¿µµÇ°í ÀÖ½À´Ï´Ù.
º´Ã¶ 11-18
¼­¹ö°¡ ´À³¢±â¿£ ¾Æ´Ñ°¡ºÁ¿ä..
ÇÑÁßÀÏ 11-18
½Ç¿Â ¹®Á¦·Î gpu TDP°¡ Á¦ÇÑ µÉ ¼ö ÀÖ³ª¿ä?
     
º´Ã¶ 11-18
¾Æ´¢ ±×³É ³ó´ãÇغýÀ´Ï´Ù. Á˼ÛÇÕ´Ï´Ù.
¹Ú¹®Çü 11-18
¸¸ÀÏ ¹®Á¦µÇ´Â ¼­¹ö°¡ DELL ÂÊÀÇ ±â¼úÁö¿øÀ» ¹ÞÀ»¼ö ÀÖ´Ù¸é ±â¼úÁö¿øÀ» ¹Þ¾Æº¸¼¼¿ä..


Á¦°¡ »ý°¢Çϱ⿡´Â

ÆÄ¿ö´Â 2400W x 4 ¶ó¼­ ÃÖ´ë ½ºÆÑÀÌ´Ù.. (ÀÎÅͳÝÀ¸·Î ÇØ´ç ¸ðµ¨ ¸®ºä±ÛÀº º» °á°ú)

Nvidia ¿¡¼­ ³ª¿Â ½ºÆÑ¿¡¼­´Â TDP´Â ÇØ´ç ¸ðµ¨ÀÌ 400W ÀÎÁö¶ó °¢ GPU´ç 400W ÀÌ»ó Àü±â¸¦ °ø±ÞÇØ ÁÙ ¼ö ÀÖ¾î¾ß ÇÑ´Ù..

TDP´Â ÃÖ´ë Àü·Â »ç¿ë·®ÀÌ ¾Æ´Ï´Ù.. ½ÇÁ¦·Î CPUµç GPUµç TDP ÃÖ´ë »óÅ·Πµ¹¸®°Ô µÇ¸é ½ÇÁ¦ Àü·Â »ç¿ë·®Àº ´õ Å©´Ù..



½Ã½ºÅÛÀº DELL ÀÌ°í ¾Æ¸¶µµ GPUµµ DELL ÆÄÃ÷·Î ºÁ¾ß Çϴµ¥ (´Ù¸¥µ¥¼­ ³¹°³·Î ±¸Çؿͼ­ Â¥Áý±â ÇÑ´Ù¸é ¾îÂîµÉÁö ¸ð¸£Áö¸¸ ¾Æ¸¶ ±â¼úÁö¿øµµ °ÅºÎµÉÁöµµ)

¸ð¶ó¸ð¶óÇصµ Á¦Á¶»ç°¡ ÇØ´ç ¼­¹ö´Â ÀçÀÏ Àß ¾Ë±â¿¡ Á¦Á¶»çÀÇ ±â¼úÁö¿øÀÌ ÀçÀÏ È®½ÇÇÏ´Ù¶ó°í »ý°¢ÇÕ´Ï´Ù..

¾Æ¸¶µµ Æß¿þ¾î ±¸¼ºÀ̳ª ¼ÂÆà ¾Æ´Ï¸é ¸î°¡Áö Àü¿ëÆÄÃ÷°¡ ¾ø´Â ±×·± ¹®Á¦ÀÏ È®·üÀÌ Å®´Ï´Ù..

Æß¿þ¾î¿Í ¹ÙÀÌ¿À½º´Â ÃÖ½ÅÀÌ ÁÁ´Ù°í´Â ÇÏÁö¸¸ ÃÖ½ÅÀ̶ó°í ²À ¹ö±×°¡ ¾ø´Ù¶ó°í´Â ´ÜÁ¤ÇÏÁö ¸øÇÏ¸ç º¸Åë ¾ÈÁ¤È­µÈ ÀçÀÏ ¸¹ÀÌ »ç¿ëµÇ´Â ¹öÁ¯ÀÌ Àֱ⿡

±×°ÍÀÌ ¾î¶² ¹öÁ¯ÀÎÁö ±â¼úÁö¿øÂÊ¿¡ È®ÀÎÇغ¸½Ã±â ¹Ù¶ø´Ï´Ù..
     
¹Ú¹®Çü 11-18
±× ¿Ü

ÆÄ¿ö ¸ðµâ Çϳª°¡ 2400W À̱⿡ Àç´ë·Î Å×½ºÆ® µÇ·Á¸é ´ë·« º®¿¡¼­ ³ª¿À´Â µ¶¸³ÀûÀÎ Äܼ¾Æ® 2°³ ±¸¸Û Áß¿¡ Çϳª¾¿¸¸ ²Å¾Æ¼­ ÃÑ Äܼ¾Æ® ´ÜÀÚ 4°³°¡ ÇÊ¿äÇÕ´Ï´Ù..

Áï Å×½ºÆ® ȯ°æÀÌ Àú ¼­¹ö¸¦ È®½ÇÇÏ°Ô µ¹¸®Áö ¸øÇϴ ȯ°æÀÏ ¼öµµ ÀÖ½À´Ï´Ù..


ÇöÀç ÆÄ¿öÀÇ ¼­¹ö »óÅ ȭ¸éÀº 2400 x2 + 2400 x 2 »óÅÂ(2+2)·Î 4800W·Î ¼ÂÆõǾî ÀÖ´Â °ÍÀ¸·Î º¸¿©Áö¸ç

¸¸ÀÏ ´Ù¸¥ ¼ÂÆÃÀÌ ÀÖ´Ù¸é 2400 x3 + 2400 »óÅÂ(3+1)·Î ÃÑ 7200W ·Î ¼ÂÆÃÀÌ °¡´ÉÇÒÁö ¸ð¸£°Ú½À´Ï´Ù..
SXM4 ¹æ½ÄÀÇ A100 80G ¸¦ PCIe ·Î °³Á¶ÇÑ Ä«µå¸¦ »ç¿ëÇÏ°í °è½Å°Í °°³×¿ä.
ÀÏ´Ü SXM4 ¸¦ °³Á¶ÇÑ Ä«µå´Â OEM À̶ó°í ÆǸŸ¦ ÇÏ°íµé Àִµ¥ NVIDIA ¿¡¼­ °ø½ÄÀûÀ¸·Î ¸¸µéÁö ¾ÊÀº ¸ðµ¨ ÀÔ´Ï´Ù.
SXM4 ¹æ½ÄÀÇ Ä«µå¸¦ ´Ù ¶â¾î¼­ PCIe ·Î Áß±¹¿¡¼­ ÀÓÀÇ °³Á¶µÈ ¸ðµ¨À̶ó°í º¸¸é µË´Ï´Ù.
±×·³À¸·Î °³Á¶ ÇÒ ¶§ ¾î¶»°Ô Çß´ÂÁö¿¡ µû¶ó µ¿ÀÛÀÌ ´Ù¸£°Ôµµ µÉ ¼öµµ ÀÖ½À´Ï´Ù.
¿À¸®Áö³¯ A100 80G SXM4 ´Â ÃÖ´ë 400W Àü·ÂÀ» »ç¿ëÇϸç, ¿À¸®Áö³¯ A100 80G PCIe ´Â ÃÖ´ë 300W Àü·ÂÀ» »ç¿ëÇÕ´Ï´Ù.
epowergate 11-19
Àü·Â ¸®¹ÌÆ®¸¦ Ç®¼ö ÀÖ´Â ¸í·É¾î°¡ ÀÖ´ÂÁö¿ä?

Ǫ´Â°Ô ¾î·ÆÁö´Â ¾ÊÀºµ¥ Á¦Á¶»ç¿¡¼­ ¿Ö Á¦ÇÑÀ» °É¾ú´ÂÁö »ý°¢ÇØ º¸¼¼¿ä


QnA
Á¦¸ñPage 18/5691
2015-12   1552145   ¹é¸Þ°¡
2014-05   5016679   Á¤ÀºÁØ1
10-29   454   Ç×°ø¸ðÇÔ
11-01   454   ȸ¿ø
10-29   455   Ç×°ø¸ðÇÔ
11-21   455   ·ç³Í
10-20   457   gusoong
11-09   457   NaHS
10-18   458   ¹«½î»Ôó·³
09-18   459   ¼­¹öÁ»Á¦¹ß
10-17   460   IÀû¿ì
11-27   460   ¸¶³ª¾Æ
10-24   460   ÀÌ´ëÈñ
10-30   460   MikroTikÀÌÁø
11-01   461   ¿ë»õ
11-03   462   sskjhgod
09-13   462   ¹ÝÆȸÇ
09-13   462   Ç×°ø¸ðÇÔ
10-10   463   °¡¼ººñ°¡ÁÁ´Ù
11-18   463   ÇÑÁßÀÏ
10-31   464   ¾Ç¸¶¶ó³×
11-23   466   LSoap