행렬 계산용 cpu :: 2cpu, 지름이 시작되는 곳!

BMT more

쓰기

행렬 계산용 cpu

DKLee

2019-10

2019-10-21 14:30:05

조회 4885 추천 0

안녕하세요.

연구실에서 계산용컴퓨터를 사려고 하는데요 대략적인 예산은 500~600만(그래픽카드 제외) 입니다.

파이썬(numpy, scipy 등등..)으로 행렬(혹은 텐서)계산을 하는데요.

보통 행렬의 크기가 300*300부터해서 1500*1500 사이즈의 행렬들을 계산합니다.

데이터들을 빠르게 얻고 싶으면 특히 cpu를 어떤식으로 맞추면 될지 궁금합니다.

답글 남겨주시면 감사하겠습니다 ^^

짧은글 일수록 신중하게.



하셀호프 2019-10 행렬 계산용 cpu가 따로 있는 것은 아니구요 그냥 클럭 높은 cpu 사시면 됩니다 참고로 요사이는 행렬 계산은 gpu (cuda)를 많이 사용합니다 KSTAR 토카막 적용 사례 http://images.nvidia.com/content/gtc-kr/part_5_spinhalf.pdf 행렬 계산용 cpu가 따로 있는 것은 아니구요 그냥 클럭 높은 cpu 사시면 됩니다 참고로 요사이는 행렬 계산은 gpu (cuda)를 많이 사용합니다 KSTAR 토카막 적용 사례 http://images.nvidia.com/content/gtc-kr/part_5_spinhalf.pdf



윤건 2019-10 Matrix 계산용이면 그냥 최신 CPU에 고클럭으로 가시면 됩니다. MMX, SSE, AVX 등의 SIMD기술이 적용될수록 계산속도는 일반적으로 배로 빨라집니다. numpy도 MKL을 이용하도록 되어있으면 병렬화되어서 코어수도 꽤 영향을 미칠겁니다. GPGPU가 Matrix계산에서 많이 빠르긴 한데 Overhead때문에 CPU보다 계산이 빨라지는 사이즈가 일반적으로 ~1M(1024x1024) 정도라서 1500x1500까지의 계산정도는 그냥 CPU를 이용하는게 편할지도 모르겠습니다. 그리고 Heavy한 계산일 경우에는 파이썬보다는 C/C++ 또는 포트란을 사용하시는게 시간면에서 훨~~~~씬 유리합니다. Matrix 계산용이면 그냥 최신 CPU에 고클럭으로 가시면 됩니다. MMX, SSE, AVX 등의 SIMD기술이 적용될수록 계산속도는 일반적으로 배로 빨라집니다. numpy도 MKL을 이용하도록 되어있으면 병렬화되어서 코어수도 꽤 영향을 미칠겁니다. GPGPU가 Matrix계산에서 많이 빠르긴 한데 Overhead때문에 CPU보다 계산이 빨라지는 사이즈가 일반적으로 ~1M(1024x1024) 정도라서 1500x1500까지의 계산정도는 그냥 CPU를 이용하는게 편할지도 모르겠습니다. 그리고 Heavy한 계산일 경우에는 파이썬보다는 C/C++ 또는 포트란을 사용하시는게 시간면에서 훨~~~~씬 유리합니다.



쓰레기단장 2019-10 음... 행렬사이즈가 클수록 오버헤드가 커진다는 건 좀 이상합니다. gpgpu에서 오버헤드는 보통 계산데이터를 메인 메모리 -> GPU메모리로 올리는 레이턴시와 그 반대로 계산끝난 결과를 gpu에서 다시 메인메모리로 올리는 레이턴시를 말하는데, 당연히 한 번에 많은 행렬계산을 하는 게 효율이 좋거든요. fp32라면 1500x1500 해봤자 9메가바이트밖에 안됩니다. 요즘 비디오 카드들메모리가 8기가는 기본으로 깔고 가는지라 저런 행렬 수백개는 연산하고도 남을 것 같아요. (이론상 8기가면 950개 정도 들어가네요. 아웃풋 행렬도 저장해야 하니까 대략 600개 정도는 한 번에 계산 가능하다고 볼 수 있겠습니다.) 물론 한계라는 게 존재하긴 하지만 그래도 충분한 수준입니다. 그리고 파이선 쓰신다면 당연히 텐서플로우 쓰실텐데, 텐서플로우 GPU세팅이 좀 까다롭긴 합니다만 한번 해 놓고 나면 간단한 API호출로도 충분히 가속을 받을 수 있으므로 굳이 C++을 쓸 필요는 없다고 생각합니다. 음... 행렬사이즈가 클수록 오버헤드가 커진다는 건 좀 이상합니다. gpgpu에서 오버헤드는 보통 계산데이터를 메인 메모리 -> GPU메모리로 올리는 레이턴시와 그 반대로 계산끝난 결과를 gpu에서 다시 메인메모리로 올리는 레이턴시를 말하는데, 당연히 한 번에 많은 행렬계산을 하는 게 효율이 좋거든요. fp32라면 1500x1500 해봤자 9메가바이트밖에 안됩니다. 요즘 비디오 카드들메모리가 8기가는 기본으로 깔고 가는지라 저런 행렬 수백개는 연산하고도 남을 것 같아요. (이론상 8기가면 950개 정도 들어가네요. 아웃풋 행렬도 저장해야 하니까 대략 600개 정도는 한 번에 계산 가능하다고 볼 수 있겠습니다.) 물론 한계라는 게 존재하긴 하지만 그래도 충분한 수준입니다. 그리고 파이선 쓰신다면 당연히 텐서플로우 쓰실텐데, 텐서플로우 GPU세팅이 좀 까다롭긴 합니다만 한번 해 놓고 나면 간단한 API호출로도 충분히 가속을 받을 수 있으므로 굳이 C++을 쓸 필요는 없다고 생각합니다.



윤건 2019-10 반대로 이해하신듯합니다만... 오버헤드때문에 일정사이즈 이상이 되어야만 GPGPU를 이용한 연산이 CPU연산보다 더 빠르다고 한 이야기였습니다. 1500x1500 ~ 2.5M 정도이긴 하지만 예를 들어 CPU로 2초짜리 연산이 GPU로 1초 연산이 되는 정도는 그냥 CPU 연산이 편하다고 생각합니다. 물론 2시간 짜리가 1시간이 되는 것은 다른 이야기 이지요... 반대로 이해하신듯합니다만... 오버헤드때문에 일정사이즈 이상이 되어야만 GPGPU를 이용한 연산이 CPU연산보다 더 빠르다고 한 이야기였습니다. 1500x1500 ~ 2.5M 정도이긴 하지만 예를 들어 CPU로 2초짜리 연산이 GPU로 1초 연산이 되는 정도는 그냥 CPU 연산이 편하다고 생각합니다. 물론 2시간 짜리가 1시간이 되는 것은 다른 이야기 이지요...



쓰레기단장 2019-10 [Overhead때문에 CPU보다 계산이 빨라지는 사이즈가 일반적으로 ~1M(1024x1024) 정도라서] 라고 하셔서 1M까지라고 생각했습니다. 제가 반대로 이해한 게 아닌 것 같아요. [Overhead때문에 CPU보다 계산이 빨라지는 사이즈가 일반적으로 1M(1024x1024)~ 부터라서] 로 쓰시는 게 맞는 것 같습니다. [Overhead때문에 CPU보다 계산이 빨라지는 사이즈가 일반적으로 ~1M(1024x1024) 정도라서] 라고 하셔서 1M까지라고 생각했습니다. 제가 반대로 이해한 게 아닌 것 같아요. [Overhead때문에 CPU보다 계산이 빨라지는 사이즈가 일반적으로 1M(1024x1024)~ 부터라서] 로 쓰시는 게 맞는 것 같습니다.



윤건 2019-10 오해의 여지가 있도록 해서 죄송합니다. 저는 "~1M"의 의미를 "백만 까지"가 아니라 "대략 백만"의 의미로 사용한 것이었습니다. 오해의 여지가 있도록 해서 죄송합니다. 저는 "~1M"의 의미를 "백만 까지"가 아니라 "대략 백만"의 의미로 사용한 것이었습니다.

로그인 하시면 댓글을 남길 수 있습니다

쓰기

QnA

쓰기

1165/5725

번호	제목Page 1165/5725	글쓴이	날짜	조회	추천
	[필독] 처음 오시는 분을 위한 안내 (737)	정은준1	2014-05	5242219	0
[필독] 처음 오시는 분을 위한 안내 (737) 2014-05 5242219 1 정은준1
	(광고) 단통법 시대의 인터넷가입 가이드(ver2.0) (234)	백메가	2015-12	1767484	25
(광고) 단통법 시대의 인터넷가입 가이드(… (234) 2015-12 1767484 1 백메가
91210	도스+wfw3.11을 만들고 있는데...메모리가 128이상되어야되겠죠? (11)	김건우	2015-03	5305	0
도스+wfw3.11을 만들고 있는데...메모리가… (11) 2015-03 5305 1 김건우
91209	(완료) docker에서 GUI 표현 문제... (6)	pika	2017-05	7851	0
(완료) docker에서 GUI 표현 문제... (6) 2017-05 7851 1 pika
91208	일산 근처 php 웹 프로그래머 분들 읽어주세요.. (3)	김제연	2016-05	4755	0
일산 근처 php 웹 프로그래머 분들 읽어주… (3) 2016-05 4755 1 김제연
91207	글로벌회사(HP, Dell 등) 워크스테이션 관련 질문 드립니다. (8)	twopaik	2017-05	4058	0
글로벌회사(HP, Dell 등) 워크스테이션 관… (8) 2017-05 4058 1 twopaik
91206	우분투에서 16테라 하드디스크 인식문제. (20)	시오훅이	2022-07	7396	0
우분투에서 16테라 하드디스크 인식문제. (20) 2022-07 7396 1 시오훅이
91205	인텔 SSD로 바꾼 결과 (3)	마이코코	2011-06	5879	0
인텔 SSD로 바꾼 결과 (3) 2011-06 5879 1 마이코코
91204	gtx 780 ti vs gtx 1080 - 혼동했습니다. (5)	하셀호프	2017-05	3814	0
gtx 780 ti vs gtx 1080 - 혼동했습니다. (5) 2017-05 3814 1 하셀호프
91203	와이파이 네트워크 생초보 질문 (9)	Nikon	2013-12	4398	0
와이파이 네트워크 생초보 질문 (9) 2013-12 4398 1 Nikon
91202	앱 유지보수 외주시 소스코드 사용권만 있으면 되나요? (2)	CARMEX	2021-01	3363	0
앱 유지보수 외주시 소스코드 사용권만 있… (2) 2021-01 3363 1 CARMEX
91201	gtxx53 노트북용 어덥터 젠더 질문 한 번 더 드립니다. 이걸 구매해야 할지... (8)	신은왜	2019-10	3484	0
gtxx53 노트북용 어덥터 젠더 질문 한 번 … (8) 2019-10 3484 1 신은왜
91200	kllisre 중국 x99 daul보드 누드부팅 테스트 하는데 전원인가가 안됩니다. (10)	슬러그	2021-01	6196	0
kllisre 중국 x99 daul보드 누드부팅 테스… (10) 2021-01 6196 1 슬러그
91199	윈도우 11 작업관리자 표시 아이콘 문의. (4)	windfantasia	2022-08	1913	0
윈도우 11 작업관리자 표시 아이콘 문의. (4) 2022-08 1913 1 windfantasia
91198	펜티엄3 튜알라틴 듀얼 sai2 파워선택 문의 (10)	소천백향	2015-04	4535	0
펜티엄3 튜알라틴 듀얼 sai2 파워선택 문의 (10) 2015-04 4535 1 소천백향
91197	컴사양 문의 드립니다 (5)	윈98	2015-04	4393	0
컴사양 문의 드립니다 (5) 2015-04 4393 1 윈98
91196	행렬 계산용 cpu (6)	DKLee	2019-10	4886	0
행렬 계산용 cpu (6) 2019-10 4886 1 DKLee
91195	저가형 VGA용 조그만 쿨러가 엄청 시끄럽네요. (10)	윈도우10	2013-12	4475	0
저가형 VGA용 조그만 쿨러가 엄청 시끄럽… (10) 2013-12 4475 1 윈도우10
91194	이런 종류의 작업에서 체크할 HDD 스펙은 무엇인가요? (3)	김영기	2011-07	6099	0
이런 종류의 작업에서 체크할 HDD 스펙은 … (3) 2011-07 6099 1 김영기
91193	서버 같은거 나르는 끌차 혹시 튼튼한거 잘 아시는분 있으신가요. (19)	김루노	2024-04	1849	0
서버 같은거 나르는 끌차 혹시 튼튼한거 … (19) 2024-04 1849 1 김루노
91192	모니터 추천을 해달라는데..... (16)	삐돌이슬픔이	2015-04	4740	0
모니터 추천을 해달라는데..... (16) 2015-04 4740 1 삐돌이슬픔이
91191	서버 2008 R2 암호 최대 길이. (2)	머재긴	2018-08	3364	0
서버 2008 R2 암호 최대 길이. (2) 2018-08 3364 1 머재긴