slurm ¼³Á¤¹ý ¾Æ½Ã´ÂºÐ ÀÖÀ¸½Å°¡¿ä ?

bangCH   
   Á¶È¸ 5082   Ãßõ 0    

 안녕하세요 어디 물어볼것이 없어 질문드립니다.

cent os7.6환경에서 slurm이라는 것을 하고 있는데 두개 노드( 마스터 노드 , 1번 노드 ) 로 설정하고 잡(job) 테스트해서 잘되고

그 다음 gpu부분을 설정하고 싶습니다. 그런데 slurm 공식홈페이지 메뉴얼 봐도 grep.conf파일 예시를 참조하면서 해보았지만  무슨소리인지 잘 몰라서 어느정도 맞춰보면서 삽집하는 끝에 싱글노드로 gpu까지만 설정할수 있는 상태입니다. 그러나  멀티노드로 gpu설정하는게 잘안됩니다.

어떤 부분이 안되냐면 grep.conf 와 slurm.conf에 gpu에 대한 정보를 넣고 서비스(slurmd ,slurmctld) 재시작하면 실패가 뜹니다. 아무레도 설정파일을 문제인데 멀티노드gpu에 대한 예시를 보고싶은데 공식홈페이지 메뉴얼은 이해가 안가네요  

혹시 gpu멀티노드 구성하는데 예시로 된 게시글 또는 커뮤니티 글 링크좀 부탁드립니다. 


ps. 한국에서는 slurm에 대한 커뮤니티나 게시글이 많이 안보이네요 ... 

안녕하세요 반갑습니다
ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
epowergate 2020-12
PBS·Î ¹Ù²ã º¸¼¼¿ä
     
bangCH 2020-12
PBS°¡ ¹º°¡¿ä .....?
          
±¸Â÷´Ï 2020-12
openpbs °°³×¿ä
bangCH 2020-12
¸¶½ºÅÍ ³ëµå´Â ( gtx 1080ti 1ea ) 1¹ø ³ëµå´Â ( ³ëÆ®ºÏ¿ë 1060 1ea) ÀÌ·¸°Ô ±¸¼ºµÇ¾ú½À´Ï´Ù.
slurmÀ¸·Î gpu Çϳª·Î ¹­À¸¸é ¼­ºñ½º ½ÇÆÐ ¶á´Ù°í grep.confÆÄÀÏ ±¸¼ºÀÌ À߸ø‰ç´Ù±×·¯´Âµ¥ È®ÀÎÇÒ¸¸ÇÑ ¿¹½Ã°¡ ¾ø¾î¼­ ¸ð¸£°Ú³×¿ä.
¾Æ¹«Æ° Çϳª·Î ¹­´Â°Ô ¾ÈµÇ´Ï ¸¶½ºÅÍ ³ëµå·Î Çϳª·Î ¼³Á¤Çϸé Àߵ˴ϴÙ.  Àâ¸í·É¾î ( # sbatch --gres=gpu:1 gpu_test.py  ¶Ç´Â # srun --greps=gpu:1 gpu_test.py)


QnA
Á¦¸ñPage 3048/5708
2014-05   5143662   Á¤ÀºÁØ1
2015-12   1677837   ¹é¸Þ°¡
2008-11   5061   ÀÌÀÎ
2007-05   5061   ³²°æ¸²
2016-04   5061   ¸ðÀÚ¶õÆ®
2018-09   5060   ¹Î»çÀå
2019-01   5060   ÇÁ·Î½Ã¾Æ
2008-12   5060   ÀåÅÂÁÖ
2012-04   5060   ¶Ñ¶Ñ±è´ë¿ø
2016-09   5060   ½½·¯±×
2007-09   5060   °èÀ¯Âù
2014-12   5060   ´ÏÆ÷
2005-07   5060   ÃÖ°æ¹Î
2008-10   5060   Á¶ÀϱÇ
2007-05   5060   Çѵ¿ÈÆ
2016-02   5060   ¿À¿ø
2018-04   5060   ´«ºÎ½Å¾Æħ
2007-09   5060   ±èÇü½Å
2017-08   5060   Dreamer
2017-04   5060   ¼­¹ý
2016-06   5060   ÁÖ¼¶ÁÖ¼¶
2014-02   5060   °¡ºü·Î±¸³ª