ν΅μ¬ μμ
- RTX 4090μ 2026λ λ‘컬 AIμ© μ΅κ³ μ λ¨μΌ μλΉμ GPUμ λλ€: 24 GB VRAM, ~1 TB/s λ©λͺ¨λ¦¬ λμν
- 70B Q4 λͺ¨λΈμ 40 GB VRAM μ΄μμ΄ νμν©λλ€ β λμΌ RTX 3090 λλ CPU μ€νλ‘λ© νμ
- Ryzen 9 9950X(Zen 5, 16μ½μ΄)λ λν λ μ΄μ΄μ λΉ λ₯Έ CPU μ€νλ‘λ©μ μ΅μ μΈ CPUμ λλ€
- DDR5-6000 μ΅μ 64 GB; 128 GBλ 70B λͺ¨λΈμ CPU μ€νλ‘λ©μ μ μ©ν μλλ‘ κ°λ₯νκ² ν©λλ€
- NVMe PCIe Gen 4/5λ 7B λͺ¨λΈμ SATAμ 10μ΄ μ΄μμ λΉν΄ 2μ΄ λ―Έλ§μ λ‘λν©λλ€
- μΈ λΉλ λͺ¨λ AM5 μμΌμ μ¬μ©ν©λλ€ β λ§λ보λ κ΅μ²΄ μμ΄ GPU/RAM μ κ·Έλ μ΄λ κ°λ₯
1λ¨κ³: $1,200 κ²½μ ν AI μν¬μ€ν μ΄μ
$1,200 κ²½μ ν λΉλλ μ€κ³ RTX 3090(24 GB VRAM)μ ν΅μ¬μΌλ‘ μ¬μ©ν©λλ€. Llama 3.3 8B Q8μ 45β60 tok/s, Qwen3 14B Q8μ 20β28 tok/s, Qwen3 32B Q4λ₯Ό 12β18 tok/sλ‘ μμ ν GPUμμ μ€νν©λλ€. RTX 3090μ 350 Wλ₯Ό μλΉν©λλ€ β κ³ νμ§ 850 W νμ μνλΌμ΄μ ν¨κ» μ¬μ©νμμμ€.
- μ 체 GPU μλλ‘ μ§μλλ λͺ¨λΈ: 7B (λͺ¨λ μμν), 13B (Q4/Q8), 14B (Q4/Q8), 30B (Q4)
- 70B μ§μ: CPU μ€νλ‘λ© νμ β ~5β8 tok/s, κΈ°λ₯μ μ΄μ§λ§ μ΄μμ μ΄μ§ μμ
- μ λ ₯ μλΉ: ~450 W μ΅λ (GPU 350 W + CPU 65 W + λλ¨Έμ§)
- κΆμ₯ νμ μνλΌμ΄: Corsair RM850x λλ λκΈ 80+ Gold
| λΆν | λͺ¨λΈ | κ°κ²© (2026λ 5μ) |
|---|---|---|
| GPU | NVIDIA RTX 3090 (μ€κ³ , 24 GB) | ~$440 |
| CPU | AMD Ryzen 7 7700X | ~$180 |
| λ§λ보λ | MSI MAG X670E Tomahawk WiFi | ~$170 |
| RAM | 64 GB DDR5-5600 (2Γ32 GB) | ~$110 |
| μ μ₯μ₯μΉ | 2 TB PCIe Gen 4 NVMe | ~$90 |
| νμ μνλΌμ΄ | 850 W 80+ Gold μΈμ¦ | ~$90 |
| μΌμ΄μ€ | λ―Έλνμ ATX, ν¬ μ¬λ‘― 3+ κ° | ~$70 |
| CPU μΏ¨λ¬ | 240mm AIO λλ νμν | ~$60 |
| ν©κ³ | ~$1,210 |
2λ¨κ³: $2,500 μΆμ²ν AI μν¬μ€ν μ΄μ
$2,500 μΆμ² λΉλλ RTX 4090(24 GB, ~1 TB/s λ©λͺ¨λ¦¬ λμν)κ³Ό AMD Ryzen 9 9950X(Zen 5, 16μ½μ΄)λ₯Ό μ€μ¬μΌλ‘ ν©λλ€. 4090μ VRAM GBλΉ 3090λ³΄λ€ 30β40% λΉ λ₯΄λ©° ν ν°λΉ μ λ ₯ μλΉκ° μ μ΅λλ€. μ΄ λΉλλ 30B Q4 λͺ¨λΈμ μμ ν GPUμμ μ²λ¦¬νκ³ , 64 GB RAMμΌλ‘ CPU μ€νλ‘λ©μ ν΅ν΄ 70B λͺ¨λΈμ 10β15 tok/sλ‘ μ€νν©λλ€.
- μ 체 GPU μλλ‘ μ§μλλ λͺ¨λΈ: 7Bβ30B (λͺ¨λ μμν), 32B (Q4λ 24 GBμ λ€μ΄λ§μ)
- 70B μ§μ: 64 GB RAMμΌλ‘ CPU μ€νλ‘λ© μ 10β15 tok/s; 128 GBλ‘ μ κ·Έλ μ΄λνλ©΄ 15β20 tok/s
- 7B Q4 μλ: Ollamaμμ ~105β125 tok/s
- 14B Q8 μλ: ~48β60 tok/s
- 30B Q4 μλ: ~28β38 tok/s
- μ λ ₯ μλΉ: ~550 W μ΅λ (GPU 450 W + CPU 65 W + λλ¨Έμ§)
| λΆν | λͺ¨λΈ | κ°κ²© (2026λ 5μ) |
|---|---|---|
| GPU | NVIDIA GeForce RTX 4090 24 GB | ~$1,650 |
| CPU | AMD Ryzen 9 9950X (16C/32T, Zen 5) | ~$420 |
| λ§λ보λ | ASUS ProArt X870E-Creator WiFi | ~$350 |
| RAM | 64 GB DDR5-6000 CL30 (2Γ32 GB) | ~$145 |
| μ μ₯μ₯μΉ | 4 TB PCIe Gen 5 NVMe | ~$200 |
| νμ μνλΌμ΄ | 1000 W 80+ Platinum μΈμ¦ | ~$150 |
| μΌμ΄μ€ | ννμ ATX, μ’μ κΈ°λ₯ | ~$120 |
| CPU μΏ¨λ¬ | 360mm AIO | ~$90 |
| ν©κ³ | ~$3,125 |
3λ¨κ³: $5,000 μ λ¬Έκ°ν 70B μν¬μ€ν μ΄μ
$5,000 μ λ¬Έκ°ν λΉλλ μ΄ 48 GB VRAMμ RTX 3090 λ κ°λ₯Ό μ¬μ©νμ¬ 70B λͺ¨λΈμ GPU μλ(25β40 tok/s)λ‘ μΆλ‘ νλ κ²μ λͺ©νλ‘ ν©λλ€. Ryzen Threadripper 7960X(24μ½μ΄, λμ λ©λͺ¨λ¦¬ λμν)λ 48 GBλ₯Ό μ΄κ³Όνλ λͺ¨λΈμ CPU μ€νλ‘λ©μ κ°μν©λλ€. 256 GB DDR5λ‘ μμνλ 140B λͺ¨λΈλ μμ ν RAMμ λ‘λν μ μμ΅λλ€.
- μ 체 GPU μλλ‘ μ§μλλ λͺ¨λΈ (μ΄ 48 GB VRAM): 7Bβ70B Q4, 30B Q8
- 70B Q4 μλ: 25β40 tok/s (Ollama ν μ λ³λ ¬ μ²λ¦¬λ‘ λ RTX 3090 λͺ¨λ νμ±)
- 256 GB RAMμΌλ‘ CPU μ€νλ‘λ©: 140B+ λͺ¨λΈμ 4β6 tok/sλ‘ μ€ν
- λμΌ GPU μ€μ : Ollamaκ° λ GPUλ₯Ό μλμΌλ‘ κ°μ§ν©λλ€. NVLink λΆνμ
- μ λ ₯ μλΉ: ~900 W μ΅λ (GPU 2Γ 700 W + CPU 350 W + λλ¨Έμ§)
- κΆμ₯ νμ μνλΌμ΄: Seasonic PRIME TX-1600W λλ λκΈ
| λΆν | λͺ¨λΈ | κ°κ²© (2026λ 5μ) |
|---|---|---|
| GPU Γ2 | 2Γ NVIDIA RTX 3090 24 GB (μ€κ³ ) | ~$880 |
| CPU | AMD Ryzen Threadripper 7960X (24C) | ~$1,300 |
| λ§λ보λ | ASUS Pro WS TRX50-SAGE WiFi | ~$650 |
| RAM | 256 GB DDR5-5200 ECC (8Γ32 GB) | ~$650 |
| μ μ₯μ₯μΉ | 8 TB PCIe Gen 4 NVMe (2Γ4 TB) | ~$360 |
| νμ μνλΌμ΄ | 1600 W Platinum λͺ¨λμ | ~$280 |
| μΌμ΄μ€ | ννμ HEDT ATX | ~$180 |
| CPU μΏ¨λ¬ | 360mm AIO + μΆκ° ν¬ | ~$120 |
| GPU λΈλ¦¬μ§/μΌμ΄λΈ | NVLink λΆνμ (Ollamaκ° λ λ€ μ¬μ©) | ~$0 |
| ν©κ³ | ~$4,420 |
λͺ¨λ λΉλλ₯Ό μν μννΈμ¨μ΄ μ€ν
νλμ¨μ΄ 쑰립 ν Ollamaλ₯Ό μμνλ λ° 10λΆ λ―Έλ§μ΄ μμλ©λλ€:
- 1Ubuntu 22.04 LTS λλ Windows 11 μ€μΉ (Ubuntuκ° CUDA μμ μ±μΌλ‘ μ νΈλ¨)
- 2nvidia.comμμ λλ
ubuntu-drivers autoinstallλ‘ NVIDIA λλΌμ΄λ² 550+ μ€μΉ - 3Ollama μ€μΉ:
curl -fsSL https://ollama.com/install.sh | sh - 4λͺ¨λΈ λ€μ΄λ‘λ:
ollama pull qwen2.5:14b-instruct-q8_0 - 5λ€νΈμν¬ μλ²λ‘ μ€ν:
OLLAMA_HOST=0.0.0.0 ollama serve - 6λΈλΌμ°μ μΈν°νμ΄μ€λ₯Ό μν΄ Open WebUI μ€μΉ:
docker run -d -p 3000:8080 --gpus all ghcr.io/open-webui/open-webui:cuda - 7λͺ¨λ κΈ°κΈ°μμ μμ ν μ격 μ κ·Όμ μν΄ Tailscale μ¬μ©
μΈ λΉλμ μ±λ₯ λΉκ΅
| λͺ¨λΈ + μμν | κ²½μ ν ($1,200) | μΆμ²ν ($2,500) | μ λ¬Έκ°ν ($5,000) |
|---|---|---|---|
| Llama 3.3 8B Q4 | 55β70 tok/s | 105β125 tok/s | 120β140 tok/s |
| Qwen3 14B Q8 | 20β28 tok/s | 48β60 tok/s | 55β70 tok/s |
| Qwen3 32B Q4 | 12β18 tok/s | 28β38 tok/s | 40β55 tok/s |
| Llama 3.3 70B Q4 | 5β8 tok/s (CPU) | 10β15 tok/s (CPU) | 25β40 tok/s (GPU) |
| Mixtral 8x22B Q4 | 15β22 tok/s | 32β45 tok/s | 45β60 tok/s |
70B λͺ¨λΈ μ€νμ μν΄ μν¬μ€ν μ΄μ μ λ§λλ κ²μ΄ λ«μ΅λκΉ, ν΄λΌμ°λμμ GPUλ₯Ό λΉλ¦¬λ κ²μ΄ λ«μ΅λκΉ?
μ κΈ°μ μΈ μ¬μ©(ν루 2μκ° μ΄μ)μ΄λΌλ©΄ μν¬μ€ν μ΄μ μ λ§λμμμ€. RunPodμ μ μ© A40 48 GBλ $0.44/hμ λλ€ β ν루 4μκ°μ΄λ©΄ μ°κ° $641μ λλ€. $3,000β4,000 μ λ¬Έκ° λΉλλ 5β6λ νμ ν΄λΌμ°λμ λΉκ΅ν΄ λ³Έμ μ΄ λ©λλ€. κ°λ μ¬μ©(ν루 1μκ° λ―Έλ§)μ΄λΌλ©΄ ν΄λΌμ°λκ° λ κ²½μ μ μ λλ€. /ko/local-llms/local-llm-cost-calculator-build-vs-rent-2026μμ λΉμ© κ³μ°κΈ°λ₯Ό νμΈνμμμ€.
λ GPUμμ Ollamaλ₯Ό μ€ννκΈ° μν΄ NVLinkκ° νμν©λκΉ?
μλλλ€. Ollamaλ CUDA ν μ λ³λ ¬ μ²λ¦¬λ₯Ό μ¬μ©νμ¬ PCIeλ₯Ό ν΅ν΄ μ¬λ¬ GPUμ λͺ¨λΈ λ μ΄μ΄λ₯Ό λΆμ°ν©λλ€ β NVLinkκ° νμ μμ΅λλ€. NVLinkλ GPU κ° λμνμ ~32 GB/s(PCIe 4.0 x16)μμ ~600 GB/sλ‘ λμ΄μ§λ§, μ΄λ νλ ¨μλ μ€μνμ§λ§ μΆλ‘ μλ μ€μνμ§ μμ΅λλ€. λμΌ RTX 3090 μ€μ μ NVLink μμ΄ μλ²½νκ² μλν©λλ€.
μ λ¬Έκ° λΉλμμ λ¨μΌ RTX 4090 λμ λμΌ RTX 3090μ μ¬μ©νλ μ΄μ λ 무μμ λκΉ?
VRAMμ΄ κ²°μ μ μμμ λλ€. λ RTX 3090 κ° 24 GB = μ΄ 48 GB, Llama 3.3 70B Q4(~40 GB)μ μΆ©λΆν©λλ€. λ¨μΌ RTX 4090μ 24 GBλ§ μμΌλ―λ‘ CPU μ€νλ‘λ© μμ΄λ 70B Q4 λͺ¨λΈμ΄ λ§μ§ μμ΅λλ€. GPU μλλ‘ 70B μΆλ‘ μ μν΄μλ λμΌ 3090μ΄ λ¬λ¬λΉ VRAMμμ μμλλ€. 30B μ΄ν λͺ¨λΈμμλ RTX 4090μ΄ λ¬λ¬λΉ λ λΉ λ¦ λλ€.
κ²½μ ν λΉλμμ μμνμ¬ μΆμ²νμΌλ‘ μ κ·Έλ μ΄λν μ μμ΅λκΉ?
μ β μΈ λΉλ λͺ¨λ AM5 μμΌ(1, 2λ¨κ³) λλ TRX50(3λ¨κ³)μ μ¬μ©ν©λλ€. λμ€μ RTX 3090μ RTX 4090μΌλ‘ κ΅μ²΄νκ±°λ λ λ²μ§Έ GPUλ₯Ό μΆκ°ν μ μμ΅λλ€. RAM λͺ¨λμ νΈνλ©λλ€. μ μΌν λΉνΈνμ±μ 1/2λ¨κ³(AM5)μ 3λ¨κ³(TRX50) μ¬μ΄μ λλ€ β Threadripperλ‘ μ ννλ €λ©΄ μ λ§λ보λμ CPUκ° νμν©λλ€.
μ λ¬Έκ° λΉλμλ μ΄λ€ μ μ μ½μΌνΈκ° νμν©λκΉ?
μ λ¬Έκ° λΉλ(λμΌ RTX 3090 + Threadripper)λ μ½μΌνΈμμ μ΅λ ~900 Wλ₯Ό μλΉν©λλ€. λ―Έκ΅ νμ€ 15A/120V μ½μΌνΈλ ~1,800 Wλ₯Ό μ§μν©λλ€ β μΆ©λΆν©λλ€. μ λ½ 16A/230V μ½μΌνΈλ ~3,680 Wλ₯Ό μ§μν©λλ€. μ΄κ³Ό μ λ ₯ μλΉλ₯Ό μ΅μννκΈ° μν΄ 80+ Platinum ν¨μ¨μ κ³ νμ§ νμ μνλΌμ΄(Seasonic, Corsair, be quiet!)λ₯Ό μ¬μ©νμμμ€.