nvidia 비디오 카드의 max threads에 대하여 찾아 보고 있는데요.

   조회 4071   추천 0    


http://stackoverflow.com/questions/6490572/cuda-how-many-concurrent-threads-in-total


 gtx 580의 경우입니다.

16개 SM,  48개 resident warps per SM

32개 threads per warps  

결국 16x48x32 = 24,576 threads 


shader core가 512개 이니까 1개당 48개 threads가 나옵니다. 


그러니까 질문은 

for (i=0; i<24576;i++) a(i) = b(i) + c(i); 

이런 cpu 코드는 gpu 코드로 바꾸면 

그냥 a=b+c를 24576개의 쓰레드에 실어서 

한큐에 계산한다는 말인가 하는 것입니다. 


이론적으로 말입니다.


실제적으로는 기술적으로 않된다 하더라고 말이지요. 

실제적으로 가능하다면 더 좋구요. 


미리 감사합니다.


짧은글 일수록 신중하게.
오홍식 2016-12
각 스레드를 구분 가능한 ID를 그 만큼 배정/생성할 수 있다는 의미로 보셔야 합니다.
그걸 한번에 가능하고 안하고는(혹은 못하고)는 스케쥴러를 포함한 아키텍쳐의 책임입니다.
CUDA는 SW와 HW를 통합하여 부르는 말입니다.. 어떤 상황의 가능성 여부는 목표로 하는 아키텍쳐도 보아야 합니다.
이규섭 2017-01
그래서 케플러부터 효율적 방식으로 쿠다개수를 줄였죠. 덕분에 개수는 확줄고 효율은 늘었습니다.
     
하셀호프 2017-01
fermi ; gtx 560, cuda core 336;
kepler ; gtx 660, cuda core (960, 1152)

어떤 기준으로 쿠다 갯수가 줄였다는 말씀이시지요?
제가 좀 이해가 가지 않아서요. 늘은거 같은데요


QnA
제목Page 1794/5699
2014-05   5102241   정은준1
2015-12   1638768   백메가
2018-04   4078   스톤콜드
2015-05   4078   악땅
2014-05   4078   윈도우10
2015-12   4078   최창현
2018-09   4078   패킷스트림
2019-02   4078   캔위드
2018-02   4078   김민석salsal
2018-04   4078   dragoune
2020-08   4079   테츠
2019-08   4079   반성만
2017-01   4079   윈도우10
2015-05   4079   BTclub
2016-01   4079   죠슈아
2017-04   4079   빠시온
2015-08   4079   e5472
2016-09   4079   장동건2014
2015-04   4079   fmsong
2016-01   4079   전설속의미…
2015-04   4079   Won낙연
2016-09   4079   타잔보이