Cuda 사용에 있어서 질문이 있습니다.

   조회 3645   추천 0    

 


안녕하세요?


Cuda 사용에 있어서 질문이 있습니다.


- 목적: 큰 사이즈 영상처리(머신비젼)

- 문제: 그래픽 카드 메모리에 데이터 긴 전송시간 발생으로 처리속도가 느려짐.

- 해결방법: N개 그래픽카드를 사용 SLI로 연결하여 전송시간 줄임.

- 검토사항:


1) 전송 속도가 빨라지는 것이 그래픽카드에 데이터를 분산하여 처리하기 때문인지?

2) 분산되어 송수신 된다면, cuda 프로그램에서 처리에 문제점은 없는지?(하나 처럼 프로그램되길 희망)

3) N개(아마2개)그래픽 카드 사용시에 고려해야할 H/W 요구사항은 무엇이 있을까요?(메인보드 선정 등등)


감사합니다.

짧은글 일수록 신중하게.
무아 2019-09
2)
머신비전으로 처리해야할 내용이 여러 영역으로 나누어 각각 처리가 가능하다면 되겠죠.
간단하게 예를 들어 영상의 평균 밝기 값을 구하는 문제라면 (이런 걸 cuda로 하진 않겠지만 쉬운 예를 든 것 입니다)
전체 영상의 평균을 구하지 않고 N 개의 서브 영역으로 구분하여 N 개의 카드로 각각의 평균을 구한뒤 그 값을 다시 평균하는 거라면 가능하겠죠.
즉, 어떤 영상처리를 하느냐 (어떤 알고리즘을 적용하느냐)에 따라 달라집니다.
경우에 따라서는 영상을 어느정도 겹치게 중복되는 영역을 만들어 나누는 방법이 가장 일반적일 것이고..
단순히 큰 영상을 나누어 전체적인 알고리즘을 별도로 실행해서 합치는 것은 안될 겁니다.
구하고자 하는 결과가 (평균 구하기 처럼) separable 한 알고리즘을 쓸 수 있을 때 만 가능합니다.

국내의 AI 머신비전 업체 중 한 곳인 라온피플에서 보내온 광고메일에는 이런 식으로 한다는 광고도 있습니다.
epowergate 2019-09
CUDA를 사용해서 개발해본지가 오래되기는 했지만 제가 아는 범위에서는 CUDA를 사용한다고 해서 Graphic Card의 메모리를 빠르게 전송하지는 않습니다.
분산해서 송수신하는 로직은 직접 개발 또는 이를 수행하는 SDK (예전에는 없었음)를 사용하셔야 할 겁니다.
하셀호프 2019-09
제가 아는 바로는 cuda를 사용하신다면 sli가 필요없습니다
글픽 2개 설치하고 1개처럼 사용하면 다 인식합니다
 개별 gpu 인식하고 각각의 cuda 코어, gpu 메모리 인식할 거라고 생각합니다
어떤 최적화가 필요한지는 저도 잘 모릅니다
cuda 메모리는  레지스터 메모리 / 로컬 메모리, shared 메모리, global 메모리가 있습니다
이런 메모리를 조정하는 것이 최적화일것이구요 저는 잘 모르는 부분입니다


QnA
제목Page 1255/5731
2015-12   1792530   백메가
2014-05   5267539   정은준1
2021-11   3865   배고프고가…
2021-11   1719   다니엘헤딩
2020-06   2504   Sakura24
2014-09   10779   나비z
2020-06   7460   다이어트중
2010-02   10683   코뿔사냥
2020-07   2957   가빠로구나
2023-07   2526   캡틴아메리카노
2010-02   9230   박종익
2016-12   4471   알파고
2020-07   2704   송진현
2010-02   20607   김건우
2014-10   6384   나파이강승훈
2013-04   6038   우앙뿌앙
2023-07   1629   김병일
2010-03   11460   chroma
2013-04   13646   미담
2014-10   5516   김건우
2016-01   4031   witbox
2021-12   3069   아마데우쓰