http://stackoverflow.com/questions/6490572/cuda-how-many-concurrent-threads-in-total
gtx 580의 경우입니다.
16개 SM, 48개 resident warps per SM
32개 threads per warps
결국 16x48x32 = 24,576 threads
shader core가 512개 이니까 1개당 48개 threads가 나옵니다.
그러니까 질문은
for (i=0; i<24576;i++) a(i) = b(i) + c(i);
이런 cpu 코드는 gpu 코드로 바꾸면
그냥 a=b+c를 24576개의 쓰레드에 실어서
한큐에 계산한다는 말인가 하는 것입니다.
이론적으로 말입니다.
실제적으로는 기술적으로 않된다 하더라고 말이지요.
실제적으로 가능하다면 더 좋구요.
미리 감사합니다.
±×°É Çѹø¿¡ °¡´ÉÇÏ°í ¾ÈÇÏ°í´Â(ȤÀº ¸øÇÏ°í)´Â ½ºÄÉÁì·¯¸¦ Æ÷ÇÔÇÑ ¾ÆÅ°ÅØÃÄÀÇ Ã¥ÀÓÀÔ´Ï´Ù.
CUDA´Â SW¿Í HW¸¦ ÅëÇÕÇÏ¿© ºÎ¸£´Â ¸»ÀÔ´Ï´Ù.. ¾î¶² »óȲÀÇ °¡´É¼º ¿©ºÎ´Â ¸ñÇ¥·Î ÇÏ´Â ¾ÆÅ°ÅØÃĵµ º¸¾Æ¾ß ÇÕ´Ï´Ù.
kepler ; gtx 660, cuda core (960, 1152)
¾î¶² ±âÁØÀ¸·Î Äí´Ù °¹¼ö°¡ ÁÙ¿´´Ù´Â ¸»¾¸À̽ÃÁö¿ä?
Á¦°¡ Á» ÀÌÇØ°¡ °¡Áö ¾Ê¾Æ¼¿ä. ´ÃÀº°Å °°Àºµ¥¿ä