ƺ llm Ǽ ߷ ǿ..

mvwiz   
   ȸ 1242   õ 0    

llm 모델 이용해서 서비스 올릴려고 하는데 모델 사이즈가 커서 80기가 이상 vram이 필요하거든요.

a100 h100은 비싸서 엄두가 안나고 

쿼드로도 대당 1000만원은 우습게 넘기고

지포스 계열은 가성비 좋긴한데 전기세 너무 먹더라구요.

그래서 맥북들을 서버로 써 볼까 하는데. 벤치 보니 vram은 가격대비 제일 싸고 속도도 rtx3080급은 나온다고 하던데 어떨까요? 

스펙만 보면 vram 대비 가성비가 오지긴 한데..

물론 전성비 넘사벽


m3 max  128gb

820만원 

56와트

안녕하세요
ª ϼ ϰ.
allentl 04-07
ѵ... 񽺸 ÷ Ѵδ մϴ. Ʃ 192 Ŭ ڿ mlx ȭ ȭ ؼ νϽ ϰ ϼž ؿ.
     
mvwiz 04-07
̶ ̴µ ٰ ̿. Ʃ m2 ۿ  󱸿.

ȭ Ƽ ?
ġ۾ ȯ °Ŷ νϽ ÷ ü ó ӵ̴ ϱ ϴ󱸿. 񽺶 ġ۾ api
mvwiz 04-07
ø ְ ΰ µ 󱸿. ϴ ֿ ؼ.
04-07
ƿ ȯ ִ ״ ߵ˴ϴ.
extra 04-08
н ƴ϶ LLM ؼ װɷ ϼ.
gemma-2b 쿡 ǽð Ȳ Ʊ ص CPUε 20~30 ð ֱ մϴ.
20 ð ʹ ü Ͻô° ͽϴ.
񽺸 ϴ ʴ Դϴ.
׸ cpu  ̳ ̹ ó ϵ ߰Ͽ κ ũٺ ū ֱ ϴ.
ٴ ƴѵ ׷ٰ ̰ Ÿ ǰ û ° .(, arm 迭 ߿ ̰ ̿ CPU ݴϴ. Ϻ ϵ Դϴ.)
ƴϸ AMD ROCm ߷м ϴ ͵ ϳ ֳ׿.
ڸ << AMD <<< Դϴ.
ư Ϲ AMD 2~10 Ͻø Ű, AMD GPU ƺ 10 ٶ ø ˴ϴ.
NPU ؼ ó κ M1  ߴµ ̻ ֱ ϴ.
¥ ϰ VRAM ӽſ ִ ΰ ø° Դϴ.
AI о߿ Ǵ ϵ ؿ ϴ° ƴ϶ Ϲ CPU Ÿ GPU ϸ 븦 ٸž մϴ.


QnA
Page 38/5662
2014-05   4889536   1
2015-12   1428485   ް
07-10   1387   Բδٱ
07-10   1083   ̴
07-10   1288   ¸𵨷
07-10   1307   bag0504
07-09   1080   I赿
07-09   1112  
07-09   974   cjsrbc
07-09   1221   ɷ
07-09   972   iroo
07-09   1199   ȸ
07-09   1009   νȫö
07-09   993   7
07-09   961   ȣ
07-09   1225  
07-08   1249   VSPress
07-08   1102   ó
07-08   1793   grzlr
07-08   1173   õǻ
07-08   1213   Sgtsteam
07-08   1519