slurm ¼³Á¤¹ý ¾Æ½Ã´ÂºÐ ÀÖÀ¸½Å°¡¿ä ?

bangCH   
   Á¶È¸ 4777   Ãßõ 0    

 안녕하세요 어디 물어볼것이 없어 질문드립니다.

cent os7.6환경에서 slurm이라는 것을 하고 있는데 두개 노드( 마스터 노드 , 1번 노드 ) 로 설정하고 잡(job) 테스트해서 잘되고

그 다음 gpu부분을 설정하고 싶습니다. 그런데 slurm 공식홈페이지 메뉴얼 봐도 grep.conf파일 예시를 참조하면서 해보았지만  무슨소리인지 잘 몰라서 어느정도 맞춰보면서 삽집하는 끝에 싱글노드로 gpu까지만 설정할수 있는 상태입니다. 그러나  멀티노드로 gpu설정하는게 잘안됩니다.

어떤 부분이 안되냐면 grep.conf 와 slurm.conf에 gpu에 대한 정보를 넣고 서비스(slurmd ,slurmctld) 재시작하면 실패가 뜹니다. 아무레도 설정파일을 문제인데 멀티노드gpu에 대한 예시를 보고싶은데 공식홈페이지 메뉴얼은 이해가 안가네요  

혹시 gpu멀티노드 구성하는데 예시로 된 게시글 또는 커뮤니티 글 링크좀 부탁드립니다. 


ps. 한국에서는 slurm에 대한 커뮤니티나 게시글이 많이 안보이네요 ... 

안녕하세요 반갑습니다
ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
epowergate 2020-12
PBS·Î ¹Ù²ã º¸¼¼¿ä
     
bangCH 2020-12
PBS°¡ ¹º°¡¿ä .....?
          
±¸Â÷´Ï 2020-12
openpbs °°³×¿ä
bangCH 2020-12
¸¶½ºÅÍ ³ëµå´Â ( gtx 1080ti 1ea ) 1¹ø ³ëµå´Â ( ³ëÆ®ºÏ¿ë 1060 1ea) ÀÌ·¸°Ô ±¸¼ºµÇ¾ú½À´Ï´Ù.
slurmÀ¸·Î gpu Çϳª·Î ¹­À¸¸é ¼­ºñ½º ½ÇÆÐ ¶á´Ù°í grep.confÆÄÀÏ ±¸¼ºÀÌ À߸ø‰ç´Ù±×·¯´Âµ¥ È®ÀÎÇÒ¸¸ÇÑ ¿¹½Ã°¡ ¾ø¾î¼­ ¸ð¸£°Ú³×¿ä.
¾Æ¹«Æ° Çϳª·Î ¹­´Â°Ô ¾ÈµÇ´Ï ¸¶½ºÅÍ ³ëµå·Î Çϳª·Î ¼³Á¤Çϸé Àߵ˴ϴÙ.  Àâ¸í·É¾î ( # sbatch --gres=gpu:1 gpu_test.py  ¶Ç´Â # srun --greps=gpu:1 gpu_test.py)


QnA
Á¦¸ñPage 3269/5707
2014-05   5136034   Á¤ÀºÁØ1
2015-12   1670875   ¹é¸Þ°¡
2019-07   4775   LSSAH
2016-10   4775   »ßµ¹À̽½ÇÄÀÌ
2017-02   4775   tjqhdtn
2006-08   4775   ÃÖ°æ¹Î
2015-01   4775   ±èÈÆ1
2017-12   4774   ÀÌ°ÇÈñ
2012-09   4774   ¾Þ¾Þ¾Þ
2016-03   4774   ½Å¿ì¼·
2019-01   4774   ÇÁ·Î½Ã¾Æ
2007-06   4774   Çѵμº
2013-12   4774   Çà¾Æ¹ü
2017-06   4774   ¿Ã»©¹ÌÀá¿Í
2015-12   4774   Áö±¸ÀÎÀÌ´Ù
2015-02   4774   ³ªÆÄÀÌ°­½ÂÈÆ
2012-06   4774   ºüÄÚµå
2017-07   4774   ´ÃÆĶõ
2007-10   4774   ÀÌ»óµ·
2015-01   4774   ¹æoÈ¿o¹®
2014-10   4774   ºÐ³ëÀÇ´Ù¿îÈú
2017-03   4774   yeondoo