nvidia 비디오 카드의 max threads에 대하여 찾아 보고 있는데요.

   조회 4212   추천 0    


http://stackoverflow.com/questions/6490572/cuda-how-many-concurrent-threads-in-total


 gtx 580의 경우입니다.

16개 SM,  48개 resident warps per SM

32개 threads per warps  

결국 16x48x32 = 24,576 threads 


shader core가 512개 이니까 1개당 48개 threads가 나옵니다. 


그러니까 질문은 

for (i=0; i<24576;i++) a(i) = b(i) + c(i); 

이런 cpu 코드는 gpu 코드로 바꾸면 

그냥 a=b+c를 24576개의 쓰레드에 실어서 

한큐에 계산한다는 말인가 하는 것입니다. 


이론적으로 말입니다.


실제적으로는 기술적으로 않된다 하더라고 말이지요. 

실제적으로 가능하다면 더 좋구요. 


미리 감사합니다.


짧은글 일수록 신중하게.
오홍식 2016-12
각 스레드를 구분 가능한 ID를 그 만큼 배정/생성할 수 있다는 의미로 보셔야 합니다.
그걸 한번에 가능하고 안하고는(혹은 못하고)는 스케쥴러를 포함한 아키텍쳐의 책임입니다.
CUDA는 SW와 HW를 통합하여 부르는 말입니다.. 어떤 상황의 가능성 여부는 목표로 하는 아키텍쳐도 보아야 합니다.
이규섭 2017-01
그래서 케플러부터 효율적 방식으로 쿠다개수를 줄였죠. 덕분에 개수는 확줄고 효율은 늘었습니다.
     
하셀호프 2017-01
fermi ; gtx 560, cuda core 336;
kepler ; gtx 660, cuda core (960, 1152)

어떤 기준으로 쿠다 갯수가 줄였다는 말씀이시지요?
제가 좀 이해가 가지 않아서요. 늘은거 같은데요


QnA
제목Page 2130/5725
2015-12   1766472   백메가
2014-05   5240956   정은준1
2017-01   6152   파커스
2017-01   6109   pilsuni
2017-01   6473   예관신규식
2017-01   6123   longhun
2017-01   5422   두cpu
2017-01   5265   하셀호프
2017-01   7574   전설속의미…
2017-01   4655   두cpu
2017-01   15367   다온
2017-01   11590   전설속의미…
2017-01   21157   AplPEC
2017-01   39648   gkdtksghk
2017-01   6872   최마루
2017-01   21141   2CPU최주희
2017-01   4885   LINKINPARK
2017-01   4743   레나
2017-01   4617   가람이당1
2017-01   4533   김건우
2017-01   5552   AplPEC
2017-01   6022   김황중