nvidia 비디오 카드의 max threads에 대하여 찾아 보고 있는데요.

   조회 4159   추천 0    


http://stackoverflow.com/questions/6490572/cuda-how-many-concurrent-threads-in-total


 gtx 580의 경우입니다.

16개 SM,  48개 resident warps per SM

32개 threads per warps  

결국 16x48x32 = 24,576 threads 


shader core가 512개 이니까 1개당 48개 threads가 나옵니다. 


그러니까 질문은 

for (i=0; i<24576;i++) a(i) = b(i) + c(i); 

이런 cpu 코드는 gpu 코드로 바꾸면 

그냥 a=b+c를 24576개의 쓰레드에 실어서 

한큐에 계산한다는 말인가 하는 것입니다. 


이론적으로 말입니다.


실제적으로는 기술적으로 않된다 하더라고 말이지요. 

실제적으로 가능하다면 더 좋구요. 


미리 감사합니다.


짧은글 일수록 신중하게.
오홍식 2016-12
각 스레드를 구분 가능한 ID를 그 만큼 배정/생성할 수 있다는 의미로 보셔야 합니다.
그걸 한번에 가능하고 안하고는(혹은 못하고)는 스케쥴러를 포함한 아키텍쳐의 책임입니다.
CUDA는 SW와 HW를 통합하여 부르는 말입니다.. 어떤 상황의 가능성 여부는 목표로 하는 아키텍쳐도 보아야 합니다.
이규섭 2017-01
그래서 케플러부터 효율적 방식으로 쿠다개수를 줄였죠. 덕분에 개수는 확줄고 효율은 늘었습니다.
     
하셀호프 2017-01
fermi ; gtx 560, cuda core 336;
kepler ; gtx 660, cuda core (960, 1152)

어떤 기준으로 쿠다 갯수가 줄였다는 말씀이시지요?
제가 좀 이해가 가지 않아서요. 늘은거 같은데요


QnA
제목Page 1794/5713
2014-05   5184377   정은준1
2015-12   1717685   백메가
2018-10   4188   김건우
2016-04   4188   최시영
2016-03   4188   수입산한우
2017-12   4188   Dishy
2020-11   4188   더이상오지마
2016-02   4188   멋쟁이오빠
2019-12   4188   GaeMi
2016-07   4188   나너우리
2020-09   4188   김민석salsal
2021-01   4189   Tails
2018-08   4189   아마데우쓰
2017-12   4189   호박고구마
2017-12   4189   블루영상
2015-08   4189   캡틴아메리카노
2015-07   4189   정은준1
2016-03   4189   머라카는데
2017-06   4189   오티스
2021-07   4189   디지유
2017-06   4189   블랙
2016-03   4189   최시영