nvidia 비디오 카드의 max threads에 대하여 찾아 보고 있는데요.

   조회 4127   추천 0    


http://stackoverflow.com/questions/6490572/cuda-how-many-concurrent-threads-in-total


 gtx 580의 경우입니다.

16개 SM,  48개 resident warps per SM

32개 threads per warps  

결국 16x48x32 = 24,576 threads 


shader core가 512개 이니까 1개당 48개 threads가 나옵니다. 


그러니까 질문은 

for (i=0; i<24576;i++) a(i) = b(i) + c(i); 

이런 cpu 코드는 gpu 코드로 바꾸면 

그냥 a=b+c를 24576개의 쓰레드에 실어서 

한큐에 계산한다는 말인가 하는 것입니다. 


이론적으로 말입니다.


실제적으로는 기술적으로 않된다 하더라고 말이지요. 

실제적으로 가능하다면 더 좋구요. 


미리 감사합니다.


짧은글 일수록 신중하게.
오홍식 2016-12
각 스레드를 구분 가능한 ID를 그 만큼 배정/생성할 수 있다는 의미로 보셔야 합니다.
그걸 한번에 가능하고 안하고는(혹은 못하고)는 스케쥴러를 포함한 아키텍쳐의 책임입니다.
CUDA는 SW와 HW를 통합하여 부르는 말입니다.. 어떤 상황의 가능성 여부는 목표로 하는 아키텍쳐도 보아야 합니다.
이규섭 2017-01
그래서 케플러부터 효율적 방식으로 쿠다개수를 줄였죠. 덕분에 개수는 확줄고 효율은 늘었습니다.
     
하셀호프 2017-01
fermi ; gtx 560, cuda core 336;
kepler ; gtx 660, cuda core (960, 1152)

어떤 기준으로 쿠다 갯수가 줄였다는 말씀이시지요?
제가 좀 이해가 가지 않아서요. 늘은거 같은데요


QnA
제목Page 1790/5708
2015-12   1677979   백메가
2014-05   5143833   정은준1
2016-11   4146   요세미치
2015-10   4146   gw08
2017-12   4146   Dishy
2019-11   4146   가성비충
2017-04   4146   AKMU
2016-11   4146   푸른늑대
2017-02   4146   라이스타일
2018-05   4147   달인
2014-04   4147   배고프고가…
2017-10   4147   햇살한스푼
2018-05   4147   monan
2015-01   4147   차평석
2017-03   4147   FAHRENHEIT
2016-09   4147   장동건2014
2017-06   4147   mt22
2018-06   4147   AI입니다
2015-12   4147   최창현
2015-05   4147   하퍼데일
2014-01   4147   앵앵앵
2014-08   4147   봄쟁이