Skip to main content
PromptQuorumPromptQuorum
ν™ˆ/κ³ κΈ‰ 둜컬 LLM/2026λ…„ 둜컬 AIλ₯Ό μœ„ν•œ 졜고의 μ›Œν¬μŠ€ν…Œμ΄μ…˜: 3κ°€μ§€ μ˜ˆμ‚° μˆ˜μ€€
Overview & Reference

2026λ…„ 둜컬 AIλ₯Ό μœ„ν•œ 졜고의 μ›Œν¬μŠ€ν…Œμ΄μ…˜: 3κ°€μ§€ μ˜ˆμ‚° μˆ˜μ€€

Β·Β·Hans Kuepper μ € Β· PromptQuorum 창립자, λ©€ν‹° λͺ¨λΈ AI λ””μŠ€νŒ¨μΉ˜ 도ꡬ Β· PromptQuorum

2026λ…„ λŒ€λΆ€λΆ„μ˜ μ‚¬μš©μžμ—κ²Œ 졜적인 둜컬 AI μ›Œν¬μŠ€ν…Œμ΄μ…˜μ€ $2,500 λΉŒλ“œμž…λ‹ˆλ‹€: RTX 4090(24 GB VRAM) + Ryzen 9 9950X + 64 GB DDR5. 7B λͺ¨λΈμ„ 100–120 tok/s둜 μ‹€ν–‰ν•˜κ³ , 14B Q8을 μ˜€ν”„λ‘œλ”© 없이 μ‹€ν–‰ν•˜λ©°, 30B Q4λ₯Ό 25–35 tok/s둜 μ‹€ν–‰ν•©λ‹ˆλ‹€ β€” μ‹€μ œ 둜컬 LLM μ‚¬μš© μ‚¬λ‘€μ˜ 95%λ₯Ό μ»€λ²„ν•©λ‹ˆλ‹€.

이 νŽ˜μ΄μ§€μ—λŠ” 타사 μ œν’ˆμ— λŒ€ν•œ μ°Έμ‘° 링크가 ν¬ν•¨λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€. PromptQuorum은 μ–΄λ–€ 제휴 ν”„λ‘œκ·Έλž¨μ—λ„ λ“±λ‘λ˜μ–΄ μžˆμ§€ μ•ŠμŠ΅λ‹ˆλ‹€ β€” μ΄λŠ” μˆ˜μˆ˜λ£Œκ°€ λ°œμƒν•˜μ§€ μ•ŠλŠ” 일반 λ§ν¬μž…λ‹ˆλ‹€. 링크 클릭 및 이후 λ‹¨κ³„λŠ” μ „μ μœΌλ‘œ κ·€ν•˜μ˜ μ±…μž„μž…λ‹ˆλ‹€. 이 λ§ν¬λŠ” PromptQuorum의 μ–΄λ– ν•œ λ³΄μ¦μ΄λ‚˜ 검증을 λ‚˜νƒ€λ‚΄μ§€ μ•ŠμŠ΅λ‹ˆλ‹€.

핡심 μš”μ 

  • RTX 4090은 2026λ…„ 둜컬 AI용 졜고의 단일 μ†ŒλΉ„μž GPUμž…λ‹ˆλ‹€: 24 GB VRAM, ~1 TB/s λ©”λͺ¨λ¦¬ λŒ€μ—­ν­
  • 70B Q4 λͺ¨λΈμ€ 40 GB VRAM 이상이 ν•„μš”ν•©λ‹ˆλ‹€ β€” λ“€μ–Ό RTX 3090 λ˜λŠ” CPU μ˜€ν”„λ‘œλ”© ν•„μš”
  • Ryzen 9 9950X(Zen 5, 16μ½”μ–΄)λŠ” λŒ€ν˜• λ ˆμ΄μ–΄μ˜ λΉ λ₯Έ CPU μ˜€ν”„λ‘œλ”©μ— 졜적인 CPUμž…λ‹ˆλ‹€
  • DDR5-6000 μ΅œμ†Œ 64 GB; 128 GBλŠ” 70B λͺ¨λΈμ˜ CPU μ˜€ν”„λ‘œλ”©μ„ μœ μš©ν•œ μ†λ„λ‘œ κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€
  • NVMe PCIe Gen 4/5λŠ” 7B λͺ¨λΈμ„ SATA의 10초 이상에 λΉ„ν•΄ 2초 λ―Έλ§Œμ— λ‘œλ“œν•©λ‹ˆλ‹€
  • μ„Έ λΉŒλ“œ λͺ¨λ‘ AM5 μ†ŒμΌ“μ„ μ‚¬μš©ν•©λ‹ˆλ‹€ β€” λ§ˆλ”λ³΄λ“œ ꡐ체 없이 GPU/RAM μ—…κ·Έλ ˆμ΄λ“œ κ°€λŠ₯

1단계: $1,200 κ²½μ œν˜• AI μ›Œν¬μŠ€ν…Œμ΄μ…˜

$1,200 κ²½μ œν˜• λΉŒλ“œλŠ” 쀑고 RTX 3090(24 GB VRAM)을 ν•΅μ‹¬μœΌλ‘œ μ‚¬μš©ν•©λ‹ˆλ‹€. Llama 3.3 8B Q8을 45–60 tok/s, Qwen3 14B Q8을 20–28 tok/s, Qwen3 32B Q4λ₯Ό 12–18 tok/s둜 μ™„μ „νžˆ GPUμ—μ„œ μ‹€ν–‰ν•©λ‹ˆλ‹€. RTX 3090은 350 Wλ₯Ό μ†ŒλΉ„ν•©λ‹ˆλ‹€ β€” κ³ ν’ˆμ§ˆ 850 W νŒŒμ›Œ μ„œν”ŒλΌμ΄μ™€ ν•¨κ»˜ μ‚¬μš©ν•˜μ‹­μ‹œμ˜€.

  • 전체 GPU μ†λ„λ‘œ μ§€μ›λ˜λŠ” λͺ¨λΈ: 7B (λͺ¨λ“  μ–‘μžν™”), 13B (Q4/Q8), 14B (Q4/Q8), 30B (Q4)
  • 70B 지원: CPU μ˜€ν”„λ‘œλ”© ν•„μš” β€” ~5–8 tok/s, κΈ°λŠ₯μ μ΄μ§€λ§Œ 이상적이지 μ•ŠμŒ
  • μ „λ ₯ μ†ŒλΉ„: ~450 W μ΅œλŒ€ (GPU 350 W + CPU 65 W + λ‚˜λ¨Έμ§€)
  • ꢌμž₯ νŒŒμ›Œ μ„œν”ŒλΌμ΄: Corsair RM850x λ˜λŠ” 동급 80+ Gold
λΆ€ν’ˆλͺ¨λΈκ°€κ²© (2026λ…„ 5μ›”)
GPUNVIDIA RTX 3090 (쀑고, 24 GB)~$440
CPUAMD Ryzen 7 7700X~$180
λ§ˆλ”λ³΄λ“œMSI MAG X670E Tomahawk WiFi~$170
RAM64 GB DDR5-5600 (2Γ—32 GB)~$110
μ €μž₯μž₯치2 TB PCIe Gen 4 NVMe~$90
νŒŒμ›Œ μ„œν”ŒλΌμ΄850 W 80+ Gold 인증~$90
μΌ€μ΄μŠ€λ―Έλ“œνƒ€μ›Œ ATX, 팬 슬둯 3+ 개~$70
CPU 쿨러240mm AIO λ˜λŠ” νƒ€μ›Œν˜•~$60
합계~$1,210
eBayμ—μ„œ 쀑고 RTX 3090μ œν’ˆ 링크 Β· 곡개됨Amazonμ—μ„œ AMD Ryzen 7 7700Xμ œν’ˆ 링크 Β· 곡개됨

2단계: $2,500 μΆ”μ²œν˜• AI μ›Œν¬μŠ€ν…Œμ΄μ…˜

$2,500 μΆ”μ²œ λΉŒλ“œλŠ” RTX 4090(24 GB, ~1 TB/s λ©”λͺ¨λ¦¬ λŒ€μ—­ν­)κ³Ό AMD Ryzen 9 9950X(Zen 5, 16μ½”μ–΄)λ₯Ό μ€‘μ‹¬μœΌλ‘œ ν•©λ‹ˆλ‹€. 4090은 VRAM GBλ‹Ή 3090보닀 30–40% λΉ λ₯΄λ©° 토큰당 μ „λ ₯ μ†ŒλΉ„κ°€ μ μŠ΅λ‹ˆλ‹€. 이 λΉŒλ“œλŠ” 30B Q4 λͺ¨λΈμ„ μ™„μ „νžˆ GPUμ—μ„œ μ²˜λ¦¬ν•˜κ³ , 64 GB RAM으둜 CPU μ˜€ν”„λ‘œλ”©μ„ 톡해 70B λͺ¨λΈμ„ 10–15 tok/s둜 μ‹€ν–‰ν•©λ‹ˆλ‹€.

  • 전체 GPU μ†λ„λ‘œ μ§€μ›λ˜λŠ” λͺ¨λΈ: 7B–30B (λͺ¨λ“  μ–‘μžν™”), 32B (Q4λŠ” 24 GB에 λ“€μ–΄λ§žμŒ)
  • 70B 지원: 64 GB RAM으둜 CPU μ˜€ν”„λ‘œλ”© μ‹œ 10–15 tok/s; 128 GB둜 μ—…κ·Έλ ˆμ΄λ“œν•˜λ©΄ 15–20 tok/s
  • 7B Q4 속도: Ollamaμ—μ„œ ~105–125 tok/s
  • 14B Q8 속도: ~48–60 tok/s
  • 30B Q4 속도: ~28–38 tok/s
  • μ „λ ₯ μ†ŒλΉ„: ~550 W μ΅œλŒ€ (GPU 450 W + CPU 65 W + λ‚˜λ¨Έμ§€)
λΆ€ν’ˆλͺ¨λΈκ°€κ²© (2026λ…„ 5μ›”)
GPUNVIDIA GeForce RTX 4090 24 GB~$1,650
CPUAMD Ryzen 9 9950X (16C/32T, Zen 5)~$420
λ§ˆλ”λ³΄λ“œASUS ProArt X870E-Creator WiFi~$350
RAM64 GB DDR5-6000 CL30 (2Γ—32 GB)~$145
μ €μž₯μž₯치4 TB PCIe Gen 5 NVMe~$200
νŒŒμ›Œ μ„œν”ŒλΌμ΄1000 W 80+ Platinum 인증~$150
μΌ€μ΄μŠ€ν’€νƒ€μ›Œ ATX, 쒋은 κΈ°λ₯˜~$120
CPU 쿨러360mm AIO~$90
합계~$3,125
Amazonμ—μ„œ RTX 4090μ œν’ˆ 링크 Β· 곡개됨Amazonμ—μ„œ Ryzen 9 9950Xμ œν’ˆ 링크 Β· 곡개됨Amazonμ—μ„œ ASUS ProArt X870Eμ œν’ˆ 링크 Β· 곡개됨

3단계: $5,000 μ „λ¬Έκ°€ν˜• 70B μ›Œν¬μŠ€ν…Œμ΄μ…˜

$5,000 μ „λ¬Έκ°€ν˜• λΉŒλ“œλŠ” 총 48 GB VRAM의 RTX 3090 두 개λ₯Ό μ‚¬μš©ν•˜μ—¬ 70B λͺ¨λΈμ„ GPU 속도(25–40 tok/s)둜 μΆ”λ‘ ν•˜λŠ” 것을 λͺ©ν‘œλ‘œ ν•©λ‹ˆλ‹€. Ryzen Threadripper 7960X(24μ½”μ–΄, 높은 λ©”λͺ¨λ¦¬ λŒ€μ—­ν­)λŠ” 48 GBλ₯Ό μ΄ˆκ³Όν•˜λŠ” λͺ¨λΈμ˜ CPU μ˜€ν”„λ‘œλ”©μ„ κ°€μ†ν•©λ‹ˆλ‹€. 256 GB DDR5둜 μ–‘μžν™”λœ 140B λͺ¨λΈλ„ μ™„μ „νžˆ RAM에 λ‘œλ“œν•  수 μžˆμŠ΅λ‹ˆλ‹€.

  • 전체 GPU μ†λ„λ‘œ μ§€μ›λ˜λŠ” λͺ¨λΈ (총 48 GB VRAM): 7B–70B Q4, 30B Q8
  • 70B Q4 속도: 25–40 tok/s (Ollama ν…μ„œ 병렬 처리둜 두 RTX 3090 λͺ¨λ‘ ν™œμ„±)
  • 256 GB RAM으둜 CPU μ˜€ν”„λ‘œλ”©: 140B+ λͺ¨λΈμ„ 4–6 tok/s둜 μ‹€ν–‰
  • λ“€μ–Ό GPU μ„€μ •: Ollamaκ°€ 두 GPUλ₯Ό μžλ™μœΌλ‘œ κ°μ§€ν•©λ‹ˆλ‹€. NVLink λΆˆν•„μš”
  • μ „λ ₯ μ†ŒλΉ„: ~900 W μ΅œλŒ€ (GPU 2Γ— 700 W + CPU 350 W + λ‚˜λ¨Έμ§€)
  • ꢌμž₯ νŒŒμ›Œ μ„œν”ŒλΌμ΄: Seasonic PRIME TX-1600W λ˜λŠ” 동급
λΆ€ν’ˆλͺ¨λΈκ°€κ²© (2026λ…„ 5μ›”)
GPU Γ—22Γ— NVIDIA RTX 3090 24 GB (쀑고)~$880
CPUAMD Ryzen Threadripper 7960X (24C)~$1,300
λ§ˆλ”λ³΄λ“œASUS Pro WS TRX50-SAGE WiFi~$650
RAM256 GB DDR5-5200 ECC (8Γ—32 GB)~$650
μ €μž₯μž₯치8 TB PCIe Gen 4 NVMe (2Γ—4 TB)~$360
νŒŒμ›Œ μ„œν”ŒλΌμ΄1600 W Platinum λͺ¨λ“ˆμ‹~$280
μΌ€μ΄μŠ€ν’€νƒ€μ›Œ HEDT ATX~$180
CPU 쿨러360mm AIO + μΆ”κ°€ 팬~$120
GPU λΈŒλ¦¬μ§€/케이블NVLink λΆˆν•„μš” (Ollamaκ°€ λ‘˜ λ‹€ μ‚¬μš©)~$0
합계~$4,420
eBayμ—μ„œ 2Γ— RTX 3090μ œν’ˆ 링크 Β· 곡개됨Amazonμ—μ„œ Ryzen Threadripper 7960Xμ œν’ˆ 링크 Β· 곡개됨Amazonμ—μ„œ ASUS TRX50-SAGEμ œν’ˆ 링크 Β· 곡개됨

λͺ¨λ“  λΉŒλ“œλ₯Ό μœ„ν•œ μ†Œν”„νŠΈμ›¨μ–΄ μŠ€νƒ

ν•˜λ“œμ›¨μ–΄ 쑰립 ν›„ Ollamaλ₯Ό μ‹œμž‘ν•˜λŠ” 데 10λΆ„ 미만이 μ†Œμš”λ©λ‹ˆλ‹€:

  1. 1
    Ubuntu 22.04 LTS λ˜λŠ” Windows 11 μ„€μΉ˜ (Ubuntuκ°€ CUDA μ•ˆμ •μ„±μœΌλ‘œ μ„ ν˜Έλ¨)
  2. 2
    nvidia.comμ—μ„œ λ˜λŠ” ubuntu-drivers autoinstall둜 NVIDIA λ“œλΌμ΄λ²„ 550+ μ„€μΉ˜
  3. 3
    Ollama μ„€μΉ˜: curl -fsSL https://ollama.com/install.sh | sh
  4. 4
    λͺ¨λΈ λ‹€μš΄λ‘œλ“œ: ollama pull qwen2.5:14b-instruct-q8_0
  5. 5
    λ„€νŠΈμ›Œν¬ μ„œλ²„λ‘œ μ‹€ν–‰: OLLAMA_HOST=0.0.0.0 ollama serve
  6. 6
    λΈŒλΌμš°μ € μΈν„°νŽ˜μ΄μŠ€λ₯Ό μœ„ν•΄ Open WebUI μ„€μΉ˜: docker run -d -p 3000:8080 --gpus all ghcr.io/open-webui/open-webui:cuda
  7. 7
    λͺ¨λ“  κΈ°κΈ°μ—μ„œ μ•ˆμ „ν•œ 원격 접근을 μœ„ν•΄ Tailscale μ‚¬μš©

μ„Έ λΉŒλ“œμ˜ μ„±λŠ₯ 비ꡐ

λͺ¨λΈ + μ–‘μžν™”κ²½μ œν˜• ($1,200)μΆ”μ²œν˜• ($2,500)μ „λ¬Έκ°€ν˜• ($5,000)
Llama 3.3 8B Q455–70 tok/s105–125 tok/s120–140 tok/s
Qwen3 14B Q820–28 tok/s48–60 tok/s55–70 tok/s
Qwen3 32B Q412–18 tok/s28–38 tok/s40–55 tok/s
Llama 3.3 70B Q45–8 tok/s (CPU)10–15 tok/s (CPU)25–40 tok/s (GPU)
Mixtral 8x22B Q415–22 tok/s32–45 tok/s45–60 tok/s

70B λͺ¨λΈ 싀행을 μœ„ν•΄ μ›Œν¬μŠ€ν…Œμ΄μ…˜μ„ λ§Œλ“œλŠ” 것이 λ‚«μŠ΅λ‹ˆκΉŒ, ν΄λΌμš°λ“œμ—μ„œ GPUλ₯Ό λΉŒλ¦¬λŠ” 것이 λ‚«μŠ΅λ‹ˆκΉŒ?

정기적인 μ‚¬μš©(ν•˜λ£¨ 2μ‹œκ°„ 이상)이라면 μ›Œν¬μŠ€ν…Œμ΄μ…˜μ„ λ§Œλ“œμ‹­μ‹œμ˜€. RunPod의 μ „μš© A40 48 GBλŠ” $0.44/hμž…λ‹ˆλ‹€ β€” ν•˜λ£¨ 4μ‹œκ°„μ΄λ©΄ μ—°κ°„ $641μž…λ‹ˆλ‹€. $3,000–4,000 μ „λ¬Έκ°€ λΉŒλ“œλŠ” 5–6λ…„ 후에 ν΄λΌμš°λ“œμ™€ 비ꡐ해 본전이 λ©λ‹ˆλ‹€. 가끔 μ‚¬μš©(ν•˜λ£¨ 1μ‹œκ°„ 미만)이라면 ν΄λΌμš°λ“œκ°€ 더 κ²½μ œμ μž…λ‹ˆλ‹€. /ko/local-llms/local-llm-cost-calculator-build-vs-rent-2026μ—μ„œ λΉ„μš© 계산기λ₯Ό ν™•μΈν•˜μ‹­μ‹œμ˜€.

두 GPUμ—μ„œ Ollamaλ₯Ό μ‹€ν–‰ν•˜κΈ° μœ„ν•΄ NVLinkκ°€ ν•„μš”ν•©λ‹ˆκΉŒ?

μ•„λ‹™λ‹ˆλ‹€. OllamaλŠ” CUDA ν…μ„œ 병렬 처리λ₯Ό μ‚¬μš©ν•˜μ—¬ PCIeλ₯Ό 톡해 μ—¬λŸ¬ GPU에 λͺ¨λΈ λ ˆμ΄μ–΄λ₯Ό λΆ„μ‚°ν•©λ‹ˆλ‹€ β€” NVLinkκ°€ ν•„μš” μ—†μŠ΅λ‹ˆλ‹€. NVLinkλŠ” GPU κ°„ λŒ€μ—­ν­μ„ ~32 GB/s(PCIe 4.0 x16)μ—μ„œ ~600 GB/s둜 λ†’μ΄μ§€λ§Œ, μ΄λŠ” ν›ˆλ ¨μ—λŠ” μ€‘μš”ν•˜μ§€λ§Œ μΆ”λ‘ μ—λŠ” μ€‘μš”ν•˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. λ“€μ–Ό RTX 3090 섀정은 NVLink 없이 μ™„λ²½ν•˜κ²Œ μž‘λ™ν•©λ‹ˆλ‹€.

μ „λ¬Έκ°€ λΉŒλ“œμ—μ„œ 단일 RTX 4090 λŒ€μ‹  λ“€μ–Ό RTX 3090을 μ‚¬μš©ν•˜λŠ” μ΄μœ λŠ” λ¬΄μ—‡μž…λ‹ˆκΉŒ?

VRAM이 결정적 μš”μ†Œμž…λ‹ˆλ‹€. 두 RTX 3090 각 24 GB = 총 48 GB, Llama 3.3 70B Q4(~40 GB)에 μΆ©λΆ„ν•©λ‹ˆλ‹€. 단일 RTX 4090은 24 GB만 μžˆμœΌλ―€λ‘œ CPU μ˜€ν”„λ‘œλ”© μ—†μ΄λŠ” 70B Q4 λͺ¨λΈμ΄ λ§žμ§€ μ•ŠμŠ΅λ‹ˆλ‹€. GPU μ†λ„λ‘œ 70B 좔둠을 μœ„ν•΄μ„œλŠ” λ“€μ–Ό 3090이 λ‹¬λŸ¬λ‹Ή VRAMμ—μ„œ μ•žμ„­λ‹ˆλ‹€. 30B μ΄ν•˜ λͺ¨λΈμ—μ„œλŠ” RTX 4090이 λ‹¬λŸ¬λ‹Ή 더 λΉ λ¦…λ‹ˆλ‹€.

κ²½μ œν˜• λΉŒλ“œμ—μ„œ μ‹œμž‘ν•˜μ—¬ μΆ”μ²œν˜•μœΌλ‘œ μ—…κ·Έλ ˆμ΄λ“œν•  수 μžˆμŠ΅λ‹ˆκΉŒ?

예 β€” μ„Έ λΉŒλ“œ λͺ¨λ‘ AM5 μ†ŒμΌ“(1, 2단계) λ˜λŠ” TRX50(3단계)을 μ‚¬μš©ν•©λ‹ˆλ‹€. λ‚˜μ€‘μ— RTX 3090을 RTX 4090으둜 κ΅μ²΄ν•˜κ±°λ‚˜ 두 번째 GPUλ₯Ό μΆ”κ°€ν•  수 μžˆμŠ΅λ‹ˆλ‹€. RAM λͺ¨λ“ˆμ€ ν˜Έν™˜λ©λ‹ˆλ‹€. μœ μΌν•œ λΉ„ν˜Έν™˜μ„±μ€ 1/2단계(AM5)와 3단계(TRX50) μ‚¬μ΄μž…λ‹ˆλ‹€ β€” Threadripper둜 μ „ν™˜ν•˜λ €λ©΄ μƒˆ λ§ˆλ”λ³΄λ“œμ™€ CPUκ°€ ν•„μš”ν•©λ‹ˆλ‹€.

μ „λ¬Έκ°€ λΉŒλ“œμ—λŠ” μ–΄λ–€ 전원 μ½˜μ„ΌνŠΈκ°€ ν•„μš”ν•©λ‹ˆκΉŒ?

μ „λ¬Έκ°€ λΉŒλ“œ(λ“€μ–Ό RTX 3090 + Threadripper)λŠ” μ½˜μ„ΌνŠΈμ—μ„œ μ΅œλŒ€ ~900 Wλ₯Ό μ†ŒλΉ„ν•©λ‹ˆλ‹€. λ―Έκ΅­ ν‘œμ€€ 15A/120V μ½˜μ„ΌνŠΈλŠ” ~1,800 Wλ₯Ό μ§€μ›ν•©λ‹ˆλ‹€ β€” μΆ©λΆ„ν•©λ‹ˆλ‹€. 유럽 16A/230V μ½˜μ„ΌνŠΈλŠ” ~3,680 Wλ₯Ό μ§€μ›ν•©λ‹ˆλ‹€. μ—΄κ³Ό μ „λ ₯ μ†ŒλΉ„λ₯Ό μ΅œμ†Œν™”ν•˜κΈ° μœ„ν•΄ 80+ Platinum 효율의 κ³ ν’ˆμ§ˆ νŒŒμ›Œ μ„œν”ŒλΌμ΄(Seasonic, Corsair, be quiet!)λ₯Ό μ‚¬μš©ν•˜μ‹­μ‹œμ˜€.

← κ³ κΈ‰ 둜컬 LLM으둜 λŒμ•„κ°€κΈ°

2026λ…„ 둜컬 AI 졜고의 μ›Œν¬μŠ€ν…Œμ΄μ…˜: 3κ°€μ§€ μ˜ˆμ‚° | PromptQuorum