slurm ¼³Á¤¹ý ¾Æ½Ã´ÂºÐ ÀÖÀ¸½Å°¡¿ä ?

bangCH   
   Á¶È¸ 4530   Ãßõ 0    

 안녕하세요 어디 물어볼것이 없어 질문드립니다.

cent os7.6환경에서 slurm이라는 것을 하고 있는데 두개 노드( 마스터 노드 , 1번 노드 ) 로 설정하고 잡(job) 테스트해서 잘되고

그 다음 gpu부분을 설정하고 싶습니다. 그런데 slurm 공식홈페이지 메뉴얼 봐도 grep.conf파일 예시를 참조하면서 해보았지만  무슨소리인지 잘 몰라서 어느정도 맞춰보면서 삽집하는 끝에 싱글노드로 gpu까지만 설정할수 있는 상태입니다. 그러나  멀티노드로 gpu설정하는게 잘안됩니다.

어떤 부분이 안되냐면 grep.conf 와 slurm.conf에 gpu에 대한 정보를 넣고 서비스(slurmd ,slurmctld) 재시작하면 실패가 뜹니다. 아무레도 설정파일을 문제인데 멀티노드gpu에 대한 예시를 보고싶은데 공식홈페이지 메뉴얼은 이해가 안가네요  

혹시 gpu멀티노드 구성하는데 예시로 된 게시글 또는 커뮤니티 글 링크좀 부탁드립니다. 


ps. 한국에서는 slurm에 대한 커뮤니티나 게시글이 많이 안보이네요 ... 

안녕하세요 반갑습니다
ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
epowergate 2020-12
PBS·Î ¹Ù²ã º¸¼¼¿ä
     
bangCH 2020-12
PBS°¡ ¹º°¡¿ä .....?
          
±¸Â÷´Ï 2020-12
openpbs °°³×¿ä
bangCH 2020-12
¸¶½ºÅÍ ³ëµå´Â ( gtx 1080ti 1ea ) 1¹ø ³ëµå´Â ( ³ëÆ®ºÏ¿ë 1060 1ea) ÀÌ·¸°Ô ±¸¼ºµÇ¾ú½À´Ï´Ù.
slurmÀ¸·Î gpu Çϳª·Î ¹­À¸¸é ¼­ºñ½º ½ÇÆÐ ¶á´Ù°í grep.confÆÄÀÏ ±¸¼ºÀÌ À߸ø‰ç´Ù±×·¯´Âµ¥ È®ÀÎÇÒ¸¸ÇÑ ¿¹½Ã°¡ ¾ø¾î¼­ ¸ð¸£°Ú³×¿ä.
¾Æ¹«Æ° Çϳª·Î ¹­´Â°Ô ¾ÈµÇ´Ï ¸¶½ºÅÍ ³ëµå·Î Çϳª·Î ¼³Á¤Çϸé Àߵ˴ϴÙ.  Àâ¸í·É¾î ( # sbatch --gres=gpu:1 gpu_test.py  ¶Ç´Â # srun --greps=gpu:1 gpu_test.py)


QnA
Á¦¸ñPage 824/5686
2015-12   1512030   ¹é¸Þ°¡
2014-05   4975885   Á¤ÀºÁØ1
2003-07   9004   È«½ÂÀÏ
2012-11   9004   ¾öû³­x
2003-05   9004   ±èÀÏȯ
2013-08   9002   ±è½Â±Ç
2003-12   9002   °èÁ¤ÈÆ
2016-04   9002   helloju
2003-03   9002   À̱⿵
2003-10   9002   ÃÖ¿¬½Â
2013-08   9001   ÇØÇǹö±×
2011-03   9001   ÀÌ´ª½º¾¾¾Ø¾¾
2016-09   9001   ´«Æõ¹ÀÌ
2011-03   9001   ¿¹°ü½Å±Ô½Ä
2013-03   9001   °¡ºü·Î±¸³ª
2014-08   9000   ¾Æ¸§´Ù¿î³ëÀ»
2003-09   9000   °­°æº¸
2013-09   9000   ÄÄÁö±â
2013-10   9000   AKAÁö´Ï
2015-10   8999   ¿¥ºê¸®¿À
2015-05   8999   ¹Î»çÀå
2015-01   8999   inquisitive