slurm ¼³Á¤¹ý ¾Æ½Ã´ÂºÐ ÀÖÀ¸½Å°¡¿ä ?

bangCH   
   Á¶È¸ 4594   Ãßõ 0    

 안녕하세요 어디 물어볼것이 없어 질문드립니다.

cent os7.6환경에서 slurm이라는 것을 하고 있는데 두개 노드( 마스터 노드 , 1번 노드 ) 로 설정하고 잡(job) 테스트해서 잘되고

그 다음 gpu부분을 설정하고 싶습니다. 그런데 slurm 공식홈페이지 메뉴얼 봐도 grep.conf파일 예시를 참조하면서 해보았지만  무슨소리인지 잘 몰라서 어느정도 맞춰보면서 삽집하는 끝에 싱글노드로 gpu까지만 설정할수 있는 상태입니다. 그러나  멀티노드로 gpu설정하는게 잘안됩니다.

어떤 부분이 안되냐면 grep.conf 와 slurm.conf에 gpu에 대한 정보를 넣고 서비스(slurmd ,slurmctld) 재시작하면 실패가 뜹니다. 아무레도 설정파일을 문제인데 멀티노드gpu에 대한 예시를 보고싶은데 공식홈페이지 메뉴얼은 이해가 안가네요  

혹시 gpu멀티노드 구성하는데 예시로 된 게시글 또는 커뮤니티 글 링크좀 부탁드립니다. 


ps. 한국에서는 slurm에 대한 커뮤니티나 게시글이 많이 안보이네요 ... 

안녕하세요 반갑습니다
ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
epowergate 2020-12
PBS·Î ¹Ù²ã º¸¼¼¿ä
     
bangCH 2020-12
PBS°¡ ¹º°¡¿ä .....?
          
±¸Â÷´Ï 2020-12
openpbs °°³×¿ä
bangCH 2020-12
¸¶½ºÅÍ ³ëµå´Â ( gtx 1080ti 1ea ) 1¹ø ³ëµå´Â ( ³ëÆ®ºÏ¿ë 1060 1ea) ÀÌ·¸°Ô ±¸¼ºµÇ¾ú½À´Ï´Ù.
slurmÀ¸·Î gpu Çϳª·Î ¹­À¸¸é ¼­ºñ½º ½ÇÆÐ ¶á´Ù°í grep.confÆÄÀÏ ±¸¼ºÀÌ À߸ø‰ç´Ù±×·¯´Âµ¥ È®ÀÎÇÒ¸¸ÇÑ ¿¹½Ã°¡ ¾ø¾î¼­ ¸ð¸£°Ú³×¿ä.
¾Æ¹«Æ° Çϳª·Î ¹­´Â°Ô ¾ÈµÇ´Ï ¸¶½ºÅÍ ³ëµå·Î Çϳª·Î ¼³Á¤Çϸé Àߵ˴ϴÙ.  Àâ¸í·É¾î ( # sbatch --gres=gpu:1 gpu_test.py  ¶Ç´Â # srun --greps=gpu:1 gpu_test.py)


QnA
Á¦¸ñPage 3344/5691
2015-12   1552824   ¹é¸Þ°¡
2014-05   5017423   Á¤ÀºÁØ1
2013-02   4592   GoodWolf
2017-02   4592   ¸®¾óÈ«±¸
2007-03   4592   ¹Ú¼ºÈÆ
2016-10   4592   DoDream
2014-05   4592   °ÉÀνÅȫö
2006-12   4592   ³ë½Â¹ü
2018-05   4592   Çϼ¿È£ÇÁ
2016-09   4592   ÀÌÇüµ¿
2016-09   4592   Revione
2018-03   4592   Æ丣¼¼¿ì½º
2014-05   4592   Nikon
2017-02   4592   µÎcpu
2020-10   4592   MoMoM
2016-01   4592   µà¾ócpu
2017-01   4592   Áú¹®Çлý
2016-08   4592   µþ±â´ëÀå
2006-11   4591   õÈñ½Â
2014-12   4591   ÇÞ»ìÇѽºÇ¬
2017-03   4591   sunmask
2007-03   4591   ¼­¿ëȯ