|
[필독] 처음 오시는 분을 위한 안내 (734) |
정은준1 |
2014-05 |
5164119 |
0 |
2014-05
5164119
1 정은준1
|
|
(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234) |
백메가 |
2015-12 |
1698296 |
25 |
2015-12
1698296
1 백메가
|
77509 |
인텔 옵테인메모리를 일반 SSD처럼 (3) |
노인님 |
2018-03 |
4236 |
0 |
2018-03
4236
1 노인님
|
77508 |
이베이/아마존/알리 구매에 적합한 신용카드 추천부탁드립니다. (4) |
박 |
2015-08 |
4236 |
0 |
2015-08
4236
1 박
|
77507 |
쿼드로 K4000 3기가로 모모나 녹스 돌려도 될까요? (1) |
두cpu |
2017-12 |
4236 |
1 |
2017-12
4236
1 두cpu
|
77506 |
노트북. 스마트폰 분해시 보쉬에 연결할수 있는 드라이버 비트 추천주세요~ (7) |
큰곰하우스 |
2017-07 |
4236 |
1 |
2017-07
4236
1 큰곰하우스
|
77505 |
현장일하면서 쓸만한 블루투스 이어폰 추천좀 해주시면... 감사하겠습니다. (6) |
걸인신홍철 |
2014-11 |
4236 |
0 |
2014-11
4236
1 걸인신홍철
|
77504 |
크롬 뒤로가기버튼 안먹히는거 수정하는법 있을까요 ?? (4) |
쿨쿨쿨 |
2018-04 |
4236 |
0 |
2018-04
4236
1 쿨쿨쿨
|
77503 |
레이드의 SSD 캐쉬 용량? (5) |
izegtob |
2015-12 |
4236 |
0 |
2015-12
4236
1 izegtob
|
77502 |
윈도10 정식발매되었나요? (6) |
김건우 |
2015-09 |
4236 |
0 |
2015-09
4236
1 김건우
|
77501 |
[해결]디스크 속도 정상인가요? (4) |
stone92김경민 |
2015-05 |
4236 |
0 |
2015-05
4236
1 stone92김경민
|
77500 |
델 프리시즌 7720과 레노보 씽크패드P71 선택은? (5) |
박종대 |
2017-08 |
4236 |
0 |
2017-08
4236
1 박종대
|
77499 |
무슨 OS에서 VISTA 64bit로 업그래이드를 할수 있나요? (5) |
다롱이 |
2016-08 |
4236 |
0 |
2016-08
4236
1 다롱이
|
77498 |
바이오스 개조 질문 (5) |
p5p41t |
2015-11 |
4236 |
0 |
2015-11
4236
1 p5p41t
|
77497 |
HP DL380e Gen8 후면 sff 디스크에서 부팅 방법? (1) |
MikroTik이진 |
2018-05 |
4236 |
0 |
2018-05
4236
1 MikroTik이진
|
77496 |
메모리 FSB 문의.... (10) |
푸하히 |
2016-01 |
4236 |
0 |
2016-01
4236
1 푸하히
|
77495 |
개인이 아닌 회사에서 구매할 중고 서버 추천해주실 만한데 없을까요? (10) |
하인도 |
2014-03 |
4236 |
0 |
2014-03
4236
1 하인도
|
77494 |
알리에서 구입한다는 말씀은 ? (6) |
한효석 |
2017-06 |
4237 |
1 |
2017-06
4237
1 한효석
|
77493 |
uefi가 안되는 메인보드에 하드 2개를 사용하여 2개의 os를 설치했는데 나중에 설치… (2) |
김건우 |
2019-08 |
4237 |
0 |
2019-08
4237
1 김건우
|
77492 |
제가 쓴글을 읽어보니 많이 애매했네요... (11) |
AplPEC |
2015-05 |
4237 |
1 |
2015-05
4237
1 AplPEC
|
77491 |
인터넷 몇번 끈어졌는지 카운트 하는 유틸은 없는지요? (4) |
미수맨 |
2016-03 |
4237 |
0 |
2016-03
4237
1 미수맨
|
77490 |
Office 365 홈 프리미엄 라이센스 관련 (2) |
나우마크 |
2013-12 |
4237 |
0 |
2013-12
4237
1 나우마크
|
그냥 클럭 높은 cpu 사시면 됩니다
참고로 요사이는 행렬 계산은 gpu (cuda)를 많이 사용합니다
KSTAR 토카막 적용 사례
http://images.nvidia.com/content/gtc-kr/part_5_spinhalf.pdf
MMX, SSE, AVX 등의 SIMD기술이 적용될수록 계산속도는 일반적으로 배로 빨라집니다.
numpy도 MKL을 이용하도록 되어있으면 병렬화되어서 코어수도 꽤 영향을 미칠겁니다.
GPGPU가 Matrix계산에서 많이 빠르긴 한데
Overhead때문에 CPU보다 계산이 빨라지는 사이즈가 일반적으로 ~1M(1024x1024) 정도라서
1500x1500까지의 계산정도는 그냥 CPU를 이용하는게 편할지도 모르겠습니다.
그리고 Heavy한 계산일 경우에는 파이썬보다는 C/C++ 또는 포트란을 사용하시는게 시간면에서 훨~~~~씬 유리합니다.
gpgpu에서 오버헤드는 보통 계산데이터를 메인 메모리 -> GPU메모리로 올리는 레이턴시와 그 반대로 계산끝난 결과를 gpu에서 다시 메인메모리로 올리는 레이턴시를 말하는데, 당연히 한 번에 많은 행렬계산을 하는 게 효율이 좋거든요. fp32라면 1500x1500 해봤자 9메가바이트밖에 안됩니다. 요즘 비디오 카드들메모리가 8기가는 기본으로 깔고 가는지라 저런 행렬 수백개는 연산하고도 남을 것 같아요. (이론상 8기가면 950개 정도 들어가네요. 아웃풋 행렬도 저장해야 하니까 대략 600개 정도는 한 번에 계산 가능하다고 볼 수 있겠습니다.) 물론 한계라는 게 존재하긴 하지만 그래도 충분한 수준입니다. 그리고 파이선 쓰신다면 당연히 텐서플로우 쓰실텐데, 텐서플로우 GPU세팅이 좀 까다롭긴 합니다만 한번 해 놓고 나면 간단한 API호출로도 충분히 가속을 받을 수 있으므로 굳이 C++을 쓸 필요는 없다고 생각합니다.
오버헤드때문에 일정사이즈 이상이 되어야만 GPGPU를 이용한 연산이 CPU연산보다 더 빠르다고 한 이야기였습니다.
1500x1500 ~ 2.5M 정도이긴 하지만 예를 들어 CPU로 2초짜리 연산이 GPU로 1초 연산이 되는 정도는 그냥 CPU 연산이 편하다고 생각합니다.
물론 2시간 짜리가 1시간이 되는 것은 다른 이야기 이지요...
라고 하셔서 1M까지라고 생각했습니다. 제가 반대로 이해한 게 아닌 것 같아요.
[Overhead때문에 CPU보다 계산이 빨라지는 사이즈가 일반적으로 1M(1024x1024)~ 부터라서]
로 쓰시는 게 맞는 것 같습니다.
저는 "~1M"의 의미를 "백만 까지"가 아니라 "대략 백만"의 의미로 사용한 것이었습니다.