slurm ¼³Á¤¹ý ¾Æ½Ã´ÂºÐ ÀÖÀ¸½Å°¡¿ä ?

bangCH   
   Á¶È¸ 4535   Ãßõ 0    

 안녕하세요 어디 물어볼것이 없어 질문드립니다.

cent os7.6환경에서 slurm이라는 것을 하고 있는데 두개 노드( 마스터 노드 , 1번 노드 ) 로 설정하고 잡(job) 테스트해서 잘되고

그 다음 gpu부분을 설정하고 싶습니다. 그런데 slurm 공식홈페이지 메뉴얼 봐도 grep.conf파일 예시를 참조하면서 해보았지만  무슨소리인지 잘 몰라서 어느정도 맞춰보면서 삽집하는 끝에 싱글노드로 gpu까지만 설정할수 있는 상태입니다. 그러나  멀티노드로 gpu설정하는게 잘안됩니다.

어떤 부분이 안되냐면 grep.conf 와 slurm.conf에 gpu에 대한 정보를 넣고 서비스(slurmd ,slurmctld) 재시작하면 실패가 뜹니다. 아무레도 설정파일을 문제인데 멀티노드gpu에 대한 예시를 보고싶은데 공식홈페이지 메뉴얼은 이해가 안가네요  

혹시 gpu멀티노드 구성하는데 예시로 된 게시글 또는 커뮤니티 글 링크좀 부탁드립니다. 


ps. 한국에서는 slurm에 대한 커뮤니티나 게시글이 많이 안보이네요 ... 

안녕하세요 반갑습니다
ªÀº±Û Àϼö·Ï ½ÅÁßÇÏ°Ô.
epowergate 2020-12
PBS·Î ¹Ù²ã º¸¼¼¿ä
     
bangCH 2020-12
PBS°¡ ¹º°¡¿ä .....?
          
±¸Â÷´Ï 2020-12
openpbs °°³×¿ä
bangCH 2020-12
¸¶½ºÅÍ ³ëµå´Â ( gtx 1080ti 1ea ) 1¹ø ³ëµå´Â ( ³ëÆ®ºÏ¿ë 1060 1ea) ÀÌ·¸°Ô ±¸¼ºµÇ¾ú½À´Ï´Ù.
slurmÀ¸·Î gpu Çϳª·Î ¹­À¸¸é ¼­ºñ½º ½ÇÆÐ ¶á´Ù°í grep.confÆÄÀÏ ±¸¼ºÀÌ À߸ø‰ç´Ù±×·¯´Âµ¥ È®ÀÎÇÒ¸¸ÇÑ ¿¹½Ã°¡ ¾ø¾î¼­ ¸ð¸£°Ú³×¿ä.
¾Æ¹«Æ° Çϳª·Î ¹­´Â°Ô ¾ÈµÇ´Ï ¸¶½ºÅÍ ³ëµå·Î Çϳª·Î ¼³Á¤Çϸé Àߵ˴ϴÙ.  Àâ¸í·É¾î ( # sbatch --gres=gpu:1 gpu_test.py  ¶Ç´Â # srun --greps=gpu:1 gpu_test.py)


QnA
Á¦¸ñPage 823/5686
2014-05   4984994   Á¤ÀºÁØ1
2015-12   1520994   ¹é¸Þ°¡
2020-12   2881   galaxyfamily
2020-12   2749   ÄËƲ¸®12
2020-12   5642   Ǫ¸£¸¥
2020-12   3442   Á¶Áø¼®
2020-12   3647   Â÷³ÝÄÄÇ»ÅÍ
2020-12   3504   ±¼··¼è
2020-12   3718   ÇãÀα¸¸¶Æ¾
2020-12   3530   ¼ÒǪ
2020-12   4091   ¾ÈÇö»ó
2020-12   2426   °­Çѱ¸
2020-12   2432   inquisitive
2020-12   2357   catstyle
2020-12   2835   pibang
2020-12   4311   ÃÖ¹ÎÀç
2020-12   2538   À¯È£ÁØ
2020-12   2813   Sans
2020-12   5176   ¯¯¸Ç
2020-12   6295   ¿¡±×¸Ó´Ï
2020-12   2753   ¿¥ÇÃ
2020-12   9218   ¹Ì¼ö¸Ç