Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/2026๋…„ Qwen 3 ๋กœ์ปฌ ์‹คํ–‰ ๋ฐฉ๋ฒ•: Ollama + LM Studio ์„ค์ • ๊ฐ€์ด๋“œ
Getting Started

2026๋…„ Qwen 3 ๋กœ์ปฌ ์‹คํ–‰ ๋ฐฉ๋ฒ•: Ollama + LM Studio ์„ค์ • ๊ฐ€์ด๋“œ

ยท10๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

16GB VRAM์ด ์žˆ๋Š” ๊ธฐ๊ธฐ ๋˜๋Š” 32GB ์ด์ƒ์˜ ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ๊ฐ–์ถ˜ Apple Silicon์—์„œ `ollama pull qwen3.6:27b`๋ฅผ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. GUI ์ ‘๊ทผ์„ ์›ํ•˜์‹œ๋ฉด LM Studio๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ๋‘ ๋ฐฉ๋ฒ• ๋ชจ๋‘ Qwen 3.6 27B๋ฅผ ์™„์ „ํžˆ ์˜คํ”„๋ผ์ธ์œผ๋กœ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ค‘์š”: `num_ctx`๋ฅผ 32768 ์ด์ƒ์œผ๋กœ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค โ€” Ollama์˜ ๊ธฐ๋ณธ๊ฐ’์ธ 2048 ํ† ํฐ์€ ๋Œ€๋ถ€๋ถ„์˜ ์‹ค์ œ ์ž‘์—…์„ ์ž˜๋ผ๋ƒ…๋‹ˆ๋‹ค.

Qwen 3.6 27B๋Š” Ollama ๋˜๋Š” LM Studio๋ฅผ ํ†ตํ•ด ์†Œ๋น„์ž์šฉ ๋‹จ์ผ GPU(16GB VRAM)์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. ์„ค์ •์—๋Š” 10๋ถ„๋„ ์ฑ„ ๊ฑธ๋ฆฌ์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์ด ๊ฐ€์ด๋“œ์—์„œ๋Š” ๋ชจ๋ธ ์„ ํƒ, ํ•˜๋“œ์›จ์–ด ์š”๊ตฌ์‚ฌํ•ญ, Ollama CLI ์„ค์น˜, LM Studio GUI ์„ค์ •, ์ค‘์š”ํ•œ num_ctx ์ˆ˜์ •, ์ „๋ ฅ ์†Œ๋น„ ๋ฐ TCO, ๊ทธ๋ฆฌ๊ณ  ๋กœ์ปฌ Qwen์„ PromptQuorum์— ์—ฐ๊ฒฐํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค.

Key Takeaways

  • ๋‘ ๊ฐ€์ง€ ๋ฐฉ๋ฒ•: Ollama(CLI, ํ—ค๋“œ๋ฆฌ์Šค, API ์ง€์›) ๋˜๋Š” LM Studio(GUI, CLI ๋ถˆํ•„์š”). ๋‘ ๋ฐฉ๋ฒ• ๋ชจ๋‘ Qwen 3.6 27B๋ฅผ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค.
  • ํ•„์ˆ˜ ์ˆ˜์ •: Ollama์˜ ๊ธฐ๋ณธ๊ฐ’์€ `num_ctx 2048`์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์‹ค์ œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž˜๋ผ๋ƒ…๋‹ˆ๋‹ค. Modelfile ๋˜๋Š” API `num_ctx` ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํ†ตํ•ด `num_ctx 32768`๋กœ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค.
  • ํ•˜๋“œ์›จ์–ด: ์ตœ์†Œ 16GB VRAM(RTX 4080). Apple Silicon M4 Pro(48GB) ๋˜๋Š” M5 Max(128GB)๋Š” EU ํ˜ธ์ŠคํŒ… ์ถ”๋ก ์˜ ๊ถŒ์žฅ ์˜ต์…˜์ž…๋‹ˆ๋‹ค.
  • GDPR: ๋กœ์ปฌ์—์„œ ์‹คํ–‰๋˜๋ฉด ๋ฐ์ดํ„ฐ๊ฐ€ ๊ธฐ๊ธฐ๋ฅผ ๋ฒ—์–ด๋‚˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. SCC๋‚˜ ์ž์ฒด ์ธํ”„๋ผ ์ •์ฑ… ์ด์™ธ์˜ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๊ณ„์•ฝ์ด ํ•„์š” ์—†์Šต๋‹ˆ๋‹ค.
  • PromptQuorum ํ†ตํ•ฉ: PromptQuorum์˜ ๋กœ์ปฌ ๋””์ŠคํŒจ์น˜ ์„ค์ •์—์„œ `OLLAMA_BASE_URL=http://localhost:11434/v1`๊ณผ `LOCAL_LLM_MODEL=qwen3.6:27b`๋ฅผ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค โ€” Anthropic API ์„ค์ •๊ณผ๋Š” ๋ณ„๋„์ž…๋‹ˆ๋‹ค.

2026๋…„์— Qwen์„ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๋Š” ์ด์œ 

2026๋…„์— Qwen 3๋ฅผ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๋ฉด HumanEval ๊ธฐ์ค€ 92.1%์— ๋‹ฌํ•˜๋Š” ๋ชจ๋ธ์„ ํ† ํฐ๋‹น โ‚ฌ0์˜ ๋น„์šฉ์œผ๋กœ ์ด์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค โ€” ์ฝ”๋”ฉ ์ž‘์—…์—์„œ Claude Sonnet 4.6์™€ ๋น„์Šทํ•˜๊ฑฐ๋‚˜ ์ด๋ฅผ ๋Šฅ๊ฐ€ํ•˜๋Š” ์ˆ˜์ค€์ž…๋‹ˆ๋‹ค. ํ•˜๋“œ์›จ์–ด ๋น„์šฉ์ด ์ƒ๊ฐ๋˜๋ฉด ๋ชจ๋“  ํ”„๋กฌํ”„ํŠธ๊ฐ€ ๋ฌด๋ฃŒ์ž…๋‹ˆ๋‹ค. ํ•˜๋ฃจ 1,000๋งŒ ํ† ํฐ์„ ์ƒ์„ฑํ•˜๋Š” 5์ธ ๊ฐœ๋ฐœํŒ€์˜ ๊ฒฝ์šฐ, ๋กœ์ปฌ ์ถ”๋ก ์€ Claude Sonnet 4.6 API ๊ฐ€๊ฒฉ ๋Œ€๋น„ ์›” ~$900๋ฅผ ์ ˆ๊ฐํ•ฉ๋‹ˆ๋‹ค.

EU GDPR ์ค€์ˆ˜๊ฐ€ ๋‘ ๋ฒˆ์งธ ์ด์œ ์ž…๋‹ˆ๋‹ค. GDPR ์ œ44์กฐ๋Š” ์ œ3๊ตญ์œผ๋กœ์˜ ๋ฐ์ดํ„ฐ ์ด์ „์„ ์ œํ•œํ•ฉ๋‹ˆ๋‹ค. EU ํ•˜๋“œ์›จ์–ด์—์„œ Qwen์„ ๋กœ์ปฌ๋กœ ์‹คํ–‰ํ•˜๋ฉด ํ”„๋กฌํ”„ํŠธ, ์ฝ”๋“œ ๋ฐ ๊ณ ๊ฐ ๋ฐ์ดํ„ฐ๊ฐ€ ์ธํ”„๋ผ๋ฅผ ๋ฒ—์–ด๋‚˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋ฏธ๊ตญ ๋˜๋Š” ์ค‘๊ตญ ์ œ๊ณต์—…์ฒด์™€์˜ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๊ณ„์•ฝ์ด ํ•„์š” ์—†์œผ๋ฉฐ, Schrems II ์œ„ํ—˜ ํ‰๊ฐ€๋‚˜ AI ๋ ˆ์ด์–ด์— ๋Œ€ํ•œ ๊ฐœ์ธ์ •๋ณด ์˜ํ–ฅ ํ‰๊ฐ€๋„ ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

์„ธ ๋ฒˆ์งธ ์ด์œ ๋Š” ์ง€์—ฐ ์‹œ๊ฐ„์ž…๋‹ˆ๋‹ค. RTX 4090์—์„œ์˜ ๋กœ์ปฌ ์ถ”๋ก ์€ ์ดˆ๋‹น 35๊ฐœ ์ด์ƒ์˜ ํ† ํฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค โ€” ์งง์€ ํ”„๋กฌํ”„ํŠธ์—์„œ๋Š” API ์‘๋‹ต ์‹œ๊ฐ„๊ณผ ๋น„์Šทํ•˜๋ฉฐ, ๊ธด ์™„์„ฑ์—์„œ๋Š” ๋„คํŠธ์›Œํฌ ์™•๋ณต ์˜ค๋ฒ„ํ—ค๋“œ๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค.

Qwen 3.6 27B๋ฅผ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๋ฉด ํ•˜๋“œ์›จ์–ด ์ดํ›„ ํ† ํฐ๋‹น ๋น„์šฉ์ด โ‚ฌ0์ด๋ฉฐ, ๋ชจ๋“  ๋ฐ์ดํ„ฐ๊ฐ€ EU ์ธํ”„๋ผ์— ์œ ์ง€๋˜๊ณ  RTX 4090์—์„œ ์ดˆ๋‹น 35๊ฐœ ์ด์ƒ์˜ ํ† ํฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM์€ AI ๋ชจ๋ธ์ด ์ž์‹ ์˜ ์ปดํ“จํ„ฐ์—์„œ ์‹คํ–‰๋œ๋‹ค๋Š” ์˜๋ฏธ์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ ํŒŒ์ผ(Qwen 3.6 27B์˜ ๊ฒฝ์šฐ ์•ฝ 17GB)์„ ๋‹ค์šด๋กœ๋“œํ•˜๋ฉด ์ž…๋ ฅํ•˜๋Š” ๋ชจ๋“  ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์‚ฌ์šฉ์ž์˜ ๊ธฐ๊ธฐ์—์„œ ์™„์ „ํžˆ ์ฒ˜๋ฆฌ๋ฉ๋‹ˆ๋‹ค โ€” ์–ด๋–ค ์„œ๋ฒ„์—๋„ ์ „์†ก๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

๐Ÿ’กTip: DeepSeek์˜ ๋ชจ๋ธ ๋ผ์ธ์—…์€ ์ž์ฃผ ๋ณ€๊ฒฝ๋ฉ๋‹ˆ๋‹ค. ๋ฐฐํฌ ์ „์— platform.deepseek.com์—์„œ ํ˜„์žฌ ๋ชจ๋ธ๋ช…๊ณผ ๊ฐ€๊ฒฉ์„ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ์ˆ˜์น˜๋Š” 2026๋…„ 5์›” ๊ธฐ์ค€์œผ๋กœ ๊ณต๊ฐœ์ ์œผ๋กœ ์ด์šฉ ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ˜์˜ํ•ฉ๋‹ˆ๋‹ค.

Qwen ๋ชจ๋ธ ์„ ํƒ

Qwen 3๋Š” ์—ฌ๋Ÿฌ ํฌ๊ธฐ๋กœ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. VRAM๊ณผ ํ•„์š”ํ•œ ํ’ˆ์งˆ์— ๋”ฐ๋ผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. ๋ชจ๋“  ํฌ๊ธฐ๋Š” Hugging Face(Qwen) ๋ฐ ๋ช…์‹œ์  ํƒœ๊ทธ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” Ollama์—์„œ ์ด์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ModelVRAMTokens/sec (RTX 4090)Best For
Qwen 3.6 27B Q4_K_M16 GB~35ํ”„๋กœ๋•์…˜ ์ฝ”๋”ฉ, ๋ณต์žกํ•œ ์ž‘์—…
Qwen 3.6 27B Q8_028 GB~20์ตœ๊ณ  ํ’ˆ์งˆ, ๋“€์–ผ GPU
Qwen 3 14B Q4_K_M9 GB~608โ€“12GB VRAM, ์ผ๋ฐ˜ ์ž‘์—…
Qwen 3 7B Q4_K_M5 GB~80์ €์‚ฌ์–‘ VRAM, ๋น ๋ฅธ ์™„์„ฑ
Qwen 3 72B Q4_K_M42 GBโ€”์ตœ๊ณ  ํ’ˆ์งˆ, Apple Silicon 96GB ์ด์ƒ

Q4_K_M์€ ๋Œ€๋ถ€๋ถ„์˜ ์‚ฌ์šฉ์ž์—๊ฒŒ ๊ถŒ์žฅ๋˜๋Š” ์–‘์žํ™” ๋ฐฉ์‹์œผ๋กœ ์ตœ๊ณ ์˜ ํ’ˆ์งˆ ๋Œ€๋น„ ํฌ๊ธฐ ๋น„์œจ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. Q8_0์€ VRAM ๋น„์šฉ์ด ๋†’์ง€๋งŒ ๋” ๋†’์€ ํ’ˆ์งˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. 27B ๋ชจ๋ธ์„ ๋‹ค์šด๋กœ๋“œํ•˜๋„๋ก ๋ช…์‹œ์  ํƒœ๊ทธ(qwen3๊ฐ€ ์•„๋‹Œ qwen3.6:27b)๋ฅผ ํ•ญ์ƒ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

ํ•˜๋“œ์›จ์–ด ์š”๊ตฌ์‚ฌํ•ญ

  • ์ตœ์†Œ์‚ฌ์–‘(Qwen 3.6 27B): 16GB VRAM GPU โ€” RTX 4080, RTX 4070 Ti Super, ๋˜๋Š” RTX 3090
  • ๊ถŒ์žฅ GPU: RTX 4090(24GB VRAM) โ€” Q4_K_M์„ ์ดˆ๋‹น 35 ํ† ํฐ์œผ๋กœ ์‹คํ–‰ํ•˜๋ฉฐ 8GB์˜ ์—ฌ์œ  ๊ณต๊ฐ„ ํ™•๋ณด
  • Apple Silicon M3/M4(ํ˜„์žฌ): 48GB ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ์˜ M3 Max ๋˜๋Š” M4 Pro โ€” ์กฐ์šฉํ•˜๊ณ  ์ „๋ ฅ ํšจ์œจ์ ์ด๋ฉฐ MLX๋ฅผ ํ†ตํ•ด ์ดˆ๋‹น 40+ ํ† ํฐ ์ฒ˜๋ฆฌ
  • Mac Mini M4 Pro(48GB): ์†Œ๋งค๊ฐ€ ~โ‚ฌ1,599, ์†Œํ˜• ํผ ํŒฉํ„ฐ, EU ์‚ฌ๋ฌด์‹ค ๋ฐฐํฌ๋ฅผ ์œ„ํ•œ ์ตœ๊ณ  TCO
  • Apple Silicon M5 Pro(64GB): ์ฐจ์„ธ๋Œ€, 307GB/s ๋ฉ”๋ชจ๋ฆฌ ๋Œ€์—ญํญ โ€” ์˜ˆ์ƒ ์ดˆ๋‹น 50+ ํ† ํฐ์œผ๋กœ Qwen 3.6 27B ์‹คํ–‰. Apple์€ M4 ๋Œ€๋น„ LLM ํ”„๋กฌํ”„ํŠธ ์ฒ˜๋ฆฌ 4๋ฐฐ ํ–ฅ์ƒ์„ ์ฃผ์žฅ
  • Apple Silicon M5 Max(128GB): 460โ€“614GB/s ๋ฉ”๋ชจ๋ฆฌ ๋Œ€์—ญํญ โ€” ์—ฌ์œ  ๊ณต๊ฐ„์„ ํ™•๋ณดํ•˜๋ฉฐ Qwen 3 72B Q4_K_M์„ ํŽธ์•ˆํ•˜๊ฒŒ ์‹คํ–‰. 2026๋…„ ์ค‘๋ฐ˜ Mac Studio ์ถœ์‹œ ์˜ˆ์ •; ํ˜„์žฌ Mac Mini๋Š” M4 Pro ํƒ‘์žฌ
  • RAM: GPU ์ถ”๋ก ๊ณผ ํ•จ๊ป˜ ์ตœ์†Œ 32GB ์‹œ์Šคํ…œ RAM; ์ „์ฒด ๊ฐœ๋ฐœ ํ™˜๊ฒฝ๊ณผ ํ•จ๊ป˜ 64GB ๊ถŒ์žฅ
  • ์ €์žฅ๊ณต๊ฐ„: Qwen 3.6 27B Q4_K_M์„ ์œ„ํ•ด 20GB ์—ฌ์œ  ๋””์Šคํฌ ๊ณต๊ฐ„(GGUF ํŒŒ์ผ ~17GB)

๐Ÿ“ŒNote: Apple Silicon ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ๋Š” CPU์™€ GPU๊ฐ€ ๊ณต์œ ํ•ฉ๋‹ˆ๋‹ค. 48GB ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ๊ฐ–์ถ˜ Mac์€ OS ๋ฐ ๋‹ค๋ฅธ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์œ„ํ•œ ์—ฌ์œ  ๊ณต๊ฐ„์„ ํ™•๋ณดํ•˜๋ฉฐ Qwen 3.6 27B Q4_K_M์„ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋กœ ์ธํ•ด ๋‹จ์ผ ์†Œํ˜• ๊ธฐ๊ธฐ์—์„œ ๊ฐ€์žฅ ์‹ค์šฉ์ ์ธ EU ํ˜ธ์ŠคํŒ… ์ถ”๋ก  ์˜ต์…˜์ด ๋ฉ๋‹ˆ๋‹ค.

๐Ÿ’กTip: M5 Max(128GB)๋Š” Qwen 3 72B๊ฐ€ ํ”„๋กœ๋•์…˜ ์†๋„๋กœ ์‹คํ–‰๋˜๋Š” ์ฒซ ๋ฒˆ์งธ Apple Silicon ๊ตฌ์„ฑ์ž…๋‹ˆ๋‹ค. ๋งค์šฐ ๊ธด ์ปจํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•˜๊ฑฐ๋‚˜ EU ๊ทœ์ œ ์›Œํฌ๋กœ๋“œ์— ์ตœ๊ณ  ํ’ˆ์งˆ์ด ํ•„์š”ํ•œ ๊ฒฝ์šฐ, M5 Max Mac Studio๊ฐ€ ๋‹จ์ผ ๊ธฐ๊ธฐ ๊ถŒ์žฅ์‚ฌํ•ญ์ž…๋‹ˆ๋‹ค.

Ollama ์„ค์ •

Ollama๋Š” Qwen 3๋ฅผ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๋Š” ๊ฐ€์žฅ ๋น ๋ฅธ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ๋ฅผ ๊ด€๋ฆฌํ•˜๊ณ , localhost:11434์—์„œ OpenAI ํ˜ธํ™˜ API๋ฅผ ์ œ๊ณตํ•˜๋ฉฐ, ์–‘์žํ™”๋ฅผ ์ž๋™์œผ๋กœ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ollama.com์—์„œ ์„ค์น˜ํ•˜์‹ญ์‹œ์˜ค.

  1. 1
    Ollama ์„ค์น˜
    Why it matters: Ollama๋Š” ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ, GGUF ํ˜•์‹์„ ์ฒ˜๋ฆฌํ•˜๊ณ  OpenAI ํ˜ธํ™˜ ๋กœ์ปฌ API๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  2. 2
    ๋ช…์‹œ์  ํƒœ๊ทธ๋กœ Qwen 3.6 27B ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ
    Why it matters: qwen3.6:27b๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ํƒœ๊ทธ ์—†์ด `qwen3`๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๊ธฐ๋ณธ์ ์œผ๋กœ 8B ๋ชจ๋ธ์ด ๋‹ค์šด๋กœ๋“œ๋ฉ๋‹ˆ๋‹ค โ€” ์ด ๊ฐ€์ด๋“œ๊ฐ€ ๋Œ€์ƒ์œผ๋กœ ํ•˜๋Š” 27B ๋ชจ๋ธ์ด ์•„๋‹™๋‹ˆ๋‹ค.
  3. 3
    ์˜ฌ๋ฐ”๋ฅธ ์ปจํ…์ŠคํŠธ ๊ธธ์ด๋กœ Modelfile ์ƒ์„ฑ
    Why it matters: ๊ธฐ๋ณธ num_ctx ๊ฐ’์ธ 2048 ํ† ํฐ์€ ์‹ค์ œ ์ฝ”๋”ฉ ์ž‘์—…์— ๋„ˆ๋ฌด ์ž‘์Šต๋‹ˆ๋‹ค. 32768 ํ† ํฐ์€ ๋Œ€๋ถ€๋ถ„์˜ ํŒŒ์ผ๊ณผ ๋Œ€ํ™”๋ฅผ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค.
  4. 4
    ์ปค์Šคํ…€ ๋ชจ๋ธ ๋นŒ๋“œ ๋ฐ ์‹คํ–‰
    Why it matters: ํ™•์žฅ๋œ ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ๊ฐ€์ง„ Qwen 3.6 27B ์ธ์Šคํ„ด์Šค๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ํ…Œ์ŠคํŠธ ํ”„๋กฌํ”„ํŠธ๋กœ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.
  5. 5
    API ์—”๋“œํฌ์ธํŠธ ํ…Œ์ŠคํŠธ
    Why it matters: Ollama๋Š” localhost:11434/v1์—์„œ OpenAI ํ˜ธํ™˜ API๋ฅผ ๋…ธ์ถœํ•ฉ๋‹ˆ๋‹ค. ์ด ์—”๋“œํฌ์ธํŠธ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ LLM ํด๋ผ์ด์–ธํŠธ, IDE ๋ฐ PromptQuorum์„ ์—ฐ๊ฒฐํ•˜์‹ญ์‹œ์˜ค.
bash
# 1๋‹จ๊ณ„ โ€” Ollama ์„ค์น˜
# macOS
brew install ollama

# Linux
curl -fsSL https://ollama.com/install.sh | sh

# Windows โ€” https://ollama.com/download ์—์„œ ๋‹ค์šด๋กœ๋“œ

# 2๋‹จ๊ณ„ โ€” Qwen 3.6 27B ๋‹ค์šด๋กœ๋“œ (๋ช…์‹œ์  ํƒœ๊ทธ ํ•„์š”)
ollama pull qwen3.6:27b
# Qwen 3.6 27B Q4_K_M (~17 GB) ๋‹ค์šด๋กœ๋“œ
# ์ฐธ๊ณ : ํƒœ๊ทธ ์—†์ด 'ollama pull qwen3'๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด 8B ๋ชจ๋ธ์ด ๋‹ค์šด๋กœ๋“œ๋จ

# 3๋‹จ๊ณ„ โ€” ์˜ฌ๋ฐ”๋ฅธ num_ctx๋กœ Modelfile ์ƒ์„ฑ
cat > Modelfile <<'EOF'
FROM qwen3.6:27b
PARAMETER num_ctx 32768
PARAMETER temperature 0.7
EOF

# 4๋‹จ๊ณ„ โ€” ๋นŒ๋“œ ๋ฐ ์‹คํ–‰
ollama create qwen3-32k -f Modelfile
ollama run qwen3-32k

# ์˜ˆ์ƒ ์ถœ๋ ฅ (Qwen ์ •์ƒ ์ž‘๋™ ์‹œ):
# >>> Write a Python function to reverse a string.
# def reverse_string(s: str) -> str:
#     return s[::-1]
#
# This function takes a string s as input and returns the reversed
# string using Python slice notation with step -1.

# 5๋‹จ๊ณ„ โ€” API ํ…Œ์ŠคํŠธ
curl http://localhost:11434/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-32k",
    "messages": [{"role": "user", "content": "Write a Python function to reverse a string."}]
  }'

โš ๏ธWarning: 3๋‹จ๊ณ„๋ฅผ ๊ฑด๋„ˆ๋›ฐ์ง€ ๋งˆ์‹ญ์‹œ์˜ค. Ollama์˜ ๊ธฐ๋ณธ num_ctx๋Š” 2048 ํ† ํฐ(์•ฝ 1,500 ๋‹จ์–ด)์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์‹ค์ œ ์ฝ”๋”ฉ ์ž‘์—…์— ๋„ˆ๋ฌด ์ž‘์Šต๋‹ˆ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ์ฝ”๋”ฉ ์ž‘์—…(ํŒŒ์ผ ์ฝ๊ธฐ, ํ•จ์ˆ˜ ์„ค๋ช…, ํ…Œ์ŠคํŠธ ์ž‘์„ฑ)์€ 8,000โ€“32,000 ํ† ํฐ์˜ ์ปจํ…์ŠคํŠธ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด ์ˆ˜์ • ์—†์ด๋Š” Qwen์ด ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž๋™์œผ๋กœ ์ž˜๋ผ๋‚ด์–ด ์ €ํ•˜๋œ ์ถœ๋ ฅ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.

LM Studio ์„ค์ •

LM Studio๋Š” CLI ๋ช…๋ น ์—†์ด ๋กœ์ปฌ LLM์„ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” GUI๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋น„๊ธฐ์ˆ  ์‚ฌ์šฉ์ž๋‚˜ Windows ์„ค์ •์˜ ๊ฒฝ์šฐ ๊ถŒ์žฅ๋˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. lmstudio.ai์—์„œ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค.

  1. 1
    LM Studio ๋‹ค์šด๋กœ๋“œ ๋ฐ ์„ค์น˜
    Why it matters: ๋กœ์ปฌ LLM ์ถ”๋ก ์„ ์œ„ํ•œ ๋ฌด๋ฃŒ ํฌ๋กœ์Šค ํ”Œ๋žซํผ GUI. CLI ๋ถˆํ•„์š”.
  2. 2
    Qwen 3 27B ๊ฒ€์ƒ‰ ๋ฐ ๋‹ค์šด๋กœ๋“œ
    Why it matters: LM Studio์˜ ๋ชจ๋ธ ๋ธŒ๋ผ์šฐ์ €๋Š” Hugging Face๋ฅผ ๊ฒ€์ƒ‰ํ•ฉ๋‹ˆ๋‹ค. "Qwen 3 27B"๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ  16GB VRAM์„ ์œ„ํ•œ Q4_K_M GGUF ๋ณ€ํ˜•์„ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.
  3. 3
    LM Studio ์„ค์ •์—์„œ ์ปจํ…์ŠคํŠธ ๊ธธ์ด ๊ตฌ์„ฑ
    Why it matters: Ollama์™€ ๋™์ผํ•œ num_ctx ๋ฌธ์ œ โ€” ๋ชจ๋ธ ๋กœ๋“œ ์ „์— ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ์—์„œ Context Length๋ฅผ 32768๋กœ ๋ณ€๊ฒฝํ•˜์‹ญ์‹œ์˜ค.
  4. 4
    ๋กœ์ปฌ ์„œ๋ฒ„ ์‹œ์ž‘
    Why it matters: LM Studio์˜ "Start Server"๋Š” localhost:1234์—์„œ OpenAI ํ˜ธํ™˜ API๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ํด๋ผ์ด์–ธํŠธ์™€ PromptQuorum์—์„œ ์ด URL์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  5. 5
    Claude Code ์„ค์น˜(์„ ํƒ์‚ฌํ•ญ)
    Why it matters: Claude Code๋Š” Claude๋ฅผ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๊ธฐ ์œ„ํ•œ Anthropic์˜ CLI์ž…๋‹ˆ๋‹ค. https://claude.com/claude-code ์—์„œ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค(๋ชจ๋“  ํ”Œ๋žซํผ: macOS, Windows, Linux).
  6. 6
    Claude Code Proxy ์„ค์น˜
    Why it matters: ๋ฌด๋ฃŒ Claude Code Proxy(OpenClaw ๊ธฐ๋ฐ˜)๋Š” Claude Code๋ฅผ ๋กœ์ปฌ LLM์— ์—ฐ๊ฒฐํ•ฉ๋‹ˆ๋‹ค. ์‹คํ–‰: `uv run python -m uvicorn server:app --host 0.0.0.0 --port 8082`. Windows์—์„œ๋Š”: `uv run python -m uvicorn server:app --host 0.0.0.0 --port 8082`๋กœ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค.
  7. 7
    ๋กœ์ปฌ Qwen์„ ์‚ฌ์šฉํ•˜๋„๋ก Claude Code ๊ตฌ์„ฑ
    Why it matters: Claude Code ์„ค์ •์—์„œ API ์—”๋“œํฌ์ธํŠธ๋ฅผ http://localhost:8082๋กœ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค. Claude Code๋Š” ํ”„๋ก์‹œ๋ฅผ ํ†ตํ•ด LM Studio ์ธ์Šคํ„ด์Šค(localhost:1234)๋กœ ์š”์ฒญ์„ ๋ผ์šฐํŒ…ํ•˜์—ฌ Qwen 3.6 27B๋ฅผ ์ฝ”๋”ฉ ์–ด์‹œ์Šคํ„ดํŠธ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋“œ๋Š” ์™„์ „ํžˆ ๋กœ์ปฌ๋กœ ์œ ์ง€๋ฉ๋‹ˆ๋‹ค.
json
// LM Studio ๋กœ์ปฌ ์„œ๋ฒ„ ๊ตฌ์„ฑ (JSON ๋‚ด๋ณด๋‚ด๊ธฐ)
{
  "model": "qwen3.6-27b-q4_k_m",
  "server": {
    "host": "localhost",
    "port": 1234,
    "cors": true
  },
  "inference": {
    "context_length": 32768,
    "temperature": 0.7,
    "gpu_layers": -1
  }
}

PromptQuorum ์—ฐ๊ฒฐ

PromptQuorum์€ ์—ฌ๋Ÿฌ LLM์— ๊ฑธ์ณ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋ผ์šฐํŒ…ํ•ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ Qwen ์ธ์Šคํ„ด์Šค๋ฅผ ๋””์ŠคํŒจ์น˜ ๋Œ€์ƒ์œผ๋กœ ์‚ฌ์šฉํ•˜๋ ค๋ฉด PromptQuorum์˜ ๋กœ์ปฌ LLM ์—”๋“œํฌ์ธํŠธ๊ฐ€ Ollama ์„œ๋ฒ„๋ฅผ ๊ฐ€๋ฆฌํ‚ค๋„๋ก ๊ตฌ์„ฑํ•˜์‹ญ์‹œ์˜ค.

์ด๊ฒƒ์€ Ollama(OpenAI ํ˜ธํ™˜) ์—”๋“œํฌ์ธํŠธ๋กœ Claude์— ์‚ฌ์šฉ๋˜๋Š” Anthropic API ๊ตฌ์„ฑ๊ณผ๋Š” ๋ณ„๊ฐœ์ž…๋‹ˆ๋‹ค. ๋‘ ๊ฐ€์ง€๋ฅผ ๋™์‹œ์— ํ™œ์„ฑํ™”ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, PromptQuorum์€ ์ž‘์—… ์œ ํ˜•๊ณผ ๋ฐ์ดํ„ฐ ๋ฏผ๊ฐ๋„์— ๋”ฐ๋ผ ๋ผ์šฐํŒ…ํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ ๋””์ŠคํŒจ์น˜ ์„ค์ •์—์„œ OLLAMA_BASE_URL์„ http://localhost:11434/v1๋กœ, LOCAL_LLM_MODEL์„ qwen3.6:27b๋กœ ์„ค์ •ํ•˜์—ฌ PromptQuorum์„ ๋กœ์ปฌ Qwen์— ์—ฐ๊ฒฐํ•˜์‹ญ์‹œ์˜ค.

bash
# PromptQuorum ๋””์ŠคํŒจ์น˜ ๊ตฌ์„ฑ โ€” Ollama๋ฅผ ํ†ตํ•œ ๋กœ์ปฌ Qwen
# .env ๋˜๋Š” PromptQuorum ์„ค์ • ํŒจ๋„์—์„œ ์„ค์ •

OLLAMA_BASE_URL=http://localhost:11434/v1
LOCAL_LLM_MODEL=qwen3.6:27b

# ๋ผ์šฐํŒ… ๊ทœ์น™ ์˜ˆ์‹œ (PromptQuorum ๋””์ŠคํŒจ์น˜):
# - task_type: code       โ†’ model: qwen3.6:27b  (๋กœ์ปฌ Ollama, GDPR ์•ˆ์ „)
# - task_type: analysis   โ†’ model: claude-sonnet-4-6 (Anthropic API, ๋ณ„๋„ ๊ตฌ์„ฑ)
# - task_type: private    โ†’ model: qwen3.6:27b  (๋กœ์ปฌ Ollama, ํด๋ผ์šฐ๋“œ ์œ ์ถœ ์—†์Œ)

๋ฌธ์ œ ํ•ด๊ฒฐ

  • ๋ชจ๋ธ ์‘๋‹ต์ด ๋ฌธ์žฅ ์ค‘๊ฐ„์— ์ž˜๋ฆผ: num_ctx๊ฐ€ ๋„ˆ๋ฌด ๋‚ฎ์Šต๋‹ˆ๋‹ค. `PARAMETER num_ctx 32768`๋กœ Modelfile์„ ์žฌ๊ตฌ์„ฑํ•˜๊ณ  `ollama create`๋กœ ๋ชจ๋ธ์„ ๋‹ค์‹œ ๋งŒ๋“œ์‹ญ์‹œ์˜ค.
  • CUDA ๋ฉ”๋ชจ๋ฆฌ ๋ถ€์กฑ ์˜ค๋ฅ˜: ๋ชจ๋ธ์ด VRAM์— ๋งž์ง€ ์•Š์Šต๋‹ˆ๋‹ค. Qwen 3 14B Q4_K_M(~9GB VRAM)์œผ๋กœ ์ „ํ™˜ํ•˜๊ฑฐ๋‚˜ 27B์˜ Q3_K_S ์–‘์žํ™”๋ฅผ ์‹œ๋„ํ•˜์‹ญ์‹œ์˜ค.
  • Ollama API๊ฐ€ 404 ๋ฐ˜ํ™˜: ๋ชจ๋ธ ์ด๋ฆ„์ด ์ •ํ™•ํžˆ ์ผ์น˜ํ•˜๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. `ollama list`๋ฅผ ์‹คํ–‰ํ•˜์—ฌ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ์„ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ํ‘œ์‹œ๋œ ์ •ํ™•ํ•œ ์ด๋ฆ„์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค(์˜ˆ: `qwen3-32k`).
  • ๋А๋ฆฐ ์ƒ์„ฑ ์†๋„(์ดˆ๋‹น 5 ํ† ํฐ ๋ฏธ๋งŒ): GPU ๋ ˆ์ด์–ด๊ฐ€ ์™„์ „ํžˆ ์˜คํ”„๋กœ๋“œ๋˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. `ollama run qwen3-32k`๋ฅผ ์‹คํ–‰ํ•˜๊ณ  `num_gpu_layers`๊ฐ€ ์ตœ๋Œ€ํ™”๋˜์–ด ์žˆ๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. GPU๋ฅผ ๋งŽ์ด ์‚ฌ์šฉํ•˜๋Š” ๋‹ค๋ฅธ ํ”„๋กœ์„ธ์Šค๊ฐ€ ์‹คํ–‰ ์ค‘์ด์ง€ ์•Š์€์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.
  • LM Studio์—์„œ "๋ชจ๋ธ ๋กœ๋“œ ์‹คํŒจ" ํ‘œ์‹œ: VRAM์ด ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค. Q4_K_M ์ปจํ…์ŠคํŠธ ๊ธธ์ด๋ฅผ 16384๋กœ ์ค„์ด๊ฑฐ๋‚˜ Qwen 3 14B๋กœ ์ „ํ™˜ํ•˜์‹ญ์‹œ์˜ค.
  • PromptQuorum์—์„œ ์ธ์ฆ ์˜ค๋ฅ˜ ๋ฐ˜ํ™˜: PromptQuorum์˜ ๋กœ์ปฌ LLM ์„ค์ •์—์„œ `OLLAMA_BASE_URL=http://localhost:11434/v1`์„ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค. ์–‘์‹์— ํ‚ค๊ฐ€ ํ•„์š”ํ•œ ๊ฒฝ์šฐ ๋น„์–ด ์žˆ์ง€ ์•Š์€ ๋ฌธ์ž์—ด์„ ์ž…๋ ฅํ•˜์‹ญ์‹œ์˜ค โ€” Ollama๋Š” API ํ‚ค ์ธ์ฆ์ด ํ•„์š” ์—†์Šต๋‹ˆ๋‹ค.
  • Ollama๊ฐ€ GPU ๋Œ€์‹  CPU ์‚ฌ์šฉ: NVIDIA์˜ ๊ฒฝ์šฐ: CUDA ๋“œ๋ผ์ด๋ฒ„๊ฐ€ ์„ค์น˜๋˜์–ด ์žˆ๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค(`nvidia-smi`์— GPU๊ฐ€ ํ‘œ์‹œ๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค). Mac์˜ ๊ฒฝ์šฐ: Ollama๋Š” Metal์„ ์ž๋™์œผ๋กœ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค โ€” ๊ตฌ์„ฑ์ด ํ•„์š” ์—†์Šต๋‹ˆ๋‹ค. Metal์ด ํ™œ์„ฑํ™”๋˜์ง€ ์•Š์€ ๊ฒฝ์šฐ ollama.com์—์„œ Ollama๋ฅผ ์žฌ์„ค์น˜ํ•˜์‹ญ์‹œ์˜ค.
  • ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ๊ฐ€ ์ค‘๋‹จ๋˜๊ฑฐ๋‚˜ ์‹คํŒจ: ๋Œ€ํ˜• ๋ชจ๋ธ(Qwen 3.6 27B ~17GB)์€ ๋А๋ฆฐ ์—ฐ๊ฒฐ์—์„œ ์‹œ๊ฐ„ ์ดˆ๊ณผ๋ฉ๋‹ˆ๋‹ค. `ollama pull qwen3.6:27b`๋ฅผ ๋‹ค์‹œ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค โ€” Ollama๋Š” ์ค‘๋‹จ๋œ ์ง€์ ์—์„œ ์žฌ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ๋˜๋Š” Hugging Face์—์„œ GGUF๋ฅผ ์ง์ ‘ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  Modelfile FROM ์ ˆ์—์„œ ๋กœ์ปฌ ๊ฒฝ๋กœ์™€ ํ•จ๊ป˜ `ollama create`๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๐Ÿ’กTip: `ollama ps`๋ฅผ ์‹คํ–‰ํ•˜์—ฌ ํ˜„์žฌ VRAM์— ๋กœ๋“œ๋œ ๋ชจ๋ธ๊ณผ ๊ฐ ๋ชจ๋ธ์ด ์†Œ๋น„ํ•˜๋Š” ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ๋” ํฐ ๋ชจ๋ธ๋กœ ์ „ํ™˜ํ•˜๊ธฐ ์ „์— `ollama stop qwen3-32k`๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์„ ์–ธ๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค.

์ „๋ ฅ ์†Œ๋น„ ๋ฐ TCO

ํ•˜๋“œ์›จ์–ด ๋น„์šฉ์€ ์ผํšŒ์„ฑ ํˆฌ์ž์ž…๋‹ˆ๋‹ค. ์ „๊ธฐ๋Š” ์ง€์†์ ์ธ ๋น„์šฉ์ž…๋‹ˆ๋‹ค. ์˜ฌ๋ฐ”๋ฅธ ํ•˜๋“œ์›จ์–ด ์„ ํƒ์€ ์ „๊ธฐ ์š”๊ธˆ, ์‚ฌ์šฉ ์‹œ๊ฐ„, EU ๋‚ด ์—ฌ๋ถ€(2026๋…„ ๋…์ผ์˜ ์ „๊ธฐ ์š”๊ธˆ์€ ํ‰๊ท  ~โ‚ฌ0.35/kWh์ธ ๋ฐ˜๋ฉด ๋ฏธ๊ตญ์€ ~$0.13/kWh)์— ๋”ฐ๋ผ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค.

RTX 4090 ์‹œ์Šคํ…œ์€ ์ถ”๋ก  ๋ถ€ํ•˜ ์‹œ ์•ฝ 450W๋ฅผ ์†Œ๋น„ํ•ฉ๋‹ˆ๋‹ค. ๋…์ผ ์ „๊ธฐ ์š”๊ธˆ์œผ๋กœ ํ•˜๋ฃจ 8์‹œ๊ฐ„ ์‹คํ–‰: 0.45kW ร— 8์‹œ๊ฐ„ ร— โ‚ฌ0.35 ร— 250 ๊ทผ๋ฌด์ผ = ์—ฐ๊ฐ„ โ‚ฌ315์˜ ์ „๊ธฐ ์š”๊ธˆ. ํ•˜๋“œ์›จ์–ด ๋น„์šฉ์€ ์™„์„ฑ ์‹œ์Šคํ…œ ๊ธฐ์ค€ ~โ‚ฌ2,000โ€“2,500์ž…๋‹ˆ๋‹ค.

Apple Silicon M5 Max Mac Studio๋Š” LLM ์ถ”๋ก  ๋ถ€ํ•˜ ์‹œ ์•ฝ 40โ€“50W๋ฅผ ์†Œ๋น„ํ•ฉ๋‹ˆ๋‹ค. ๋™์ผ ์‹œ๋‚˜๋ฆฌ์˜ค: 0.05kW ร— 8์‹œ๊ฐ„ ร— โ‚ฌ0.35 ร— 250์ผ = ์—ฐ๊ฐ„ โ‚ฌ35์˜ ์ „๊ธฐ ์š”๊ธˆ. ํ•˜๋“œ์›จ์–ด ๋น„์šฉ์€ 128GB M5 Max Mac Studio ๊ธฐ์ค€ ~โ‚ฌ3,000โ€“4,000์ž…๋‹ˆ๋‹ค.

๋‹จ์ผ ๊ฐœ๋ฐœ์ž ๊ธฐ์ค€ ํ•˜๋ฃจ 1,000๋งŒ ํ† ํฐ์˜ Claude Sonnet 4.6 API์™€ ๋น„๊ต: 1,000๋งŒ ํ† ํฐ ร— $3/100๋งŒ ร— 250์ผ = ์—ฐ๊ฐ„ $7,500.

OptionHardwareElectricity/year (EU)API cost/year (10M tok/day)Break-even
Claude Sonnet 4.6 APIโ€”โ€”$7,500โ€”
RTX 4090 ์‹œ์Šคํ…œ + ๋กœ์ปฌ Qwenโ‚ฌ2,200โ‚ฌ315$0Claude ๋Œ€๋น„ ~4๊ฐœ์›”
Mac Mini M4 Pro (48GB)โ‚ฌ1,599โ‚ฌ25$0Claude ๋Œ€๋น„ ~3๊ฐœ์›”
Mac Studio M5 Max (128GB)~โ‚ฌ3,500โ‚ฌ35$0Claude ๋Œ€๋น„ ~6๊ฐœ์›”

โ€ขImportant: ๋†’์€ ์ „๊ธฐ ์š”๊ธˆ ์ง€์—ญ์˜ EU ํŒ€์—๊ฒŒ Mac Mini M4 Pro(48GB)๋Š” ์ตœ๊ณ ์˜ TCO๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค: ํ•˜๋“œ์›จ์–ด์™€ ์ „๊ธฐ๋ฅผ ํ•ฉ์‚ฐํ•œ ๋น„์šฉ์ด ๊ฐ€์žฅ ๋‚ฎ์œผ๋ฉฐ, ์„ค๊ณ„์ƒ GDPR ์ค€์ˆ˜๋ฅผ ๋ณด์žฅํ•˜๊ณ  ์‚ฌ๋ฌด์‹ค ํ™˜๊ฒฝ์—์„œ ์กฐ์šฉํ•˜๊ฒŒ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค. Mac Studio M5 Max๋Š” Qwen 3 72B ํ’ˆ์งˆ์ด ํ•„์š”ํ•œ ํŒ€์„ ์œ„ํ•œ ์—…๊ทธ๋ ˆ์ด๋“œ ๊ฒฝ๋กœ์ž…๋‹ˆ๋‹ค.

FAQ

Qwen 3๋ฅผ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๊ธฐ ์œ„ํ•œ ์ตœ์†Œ ํ•˜๋“œ์›จ์–ด๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”?

Q4_K_M ์–‘์žํ™”์˜ Qwen 3.6 27B์˜ ๊ฒฝ์šฐ: 16GB VRAM GPU โ€” RTX 4080 ๋˜๋Š” RTX 3090. Apple Silicon์˜ ๊ฒฝ์šฐ: 36GB ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ์˜ M3 Pro ๋˜๋Š” 48GB์˜ M3 Max. ๋” ์ž‘์€ Qwen 3 14B์˜ ๊ฒฝ์šฐ: 9GB VRAM(RTX 3080 ๋˜๋Š” RTX 4070). Qwen 3 7B๋Š” 5GB VRAM(GTX 1080 ์ด์ƒ)์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.

Ollama๊ฐ€ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž˜๋ผ๋‚ด๋Š” ์ด์œ ๋Š” ๋ฌด์—‡์ธ๊ฐ€์š”?

Ollama๋Š” ๊ธฐ๋ณธ๊ฐ’์œผ๋กœ num_ctx 2048 ํ† ํฐ(~1,500 ๋‹จ์–ด)์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์‹ค์ œ ์ฝ”๋”ฉ ์ž‘์—…์— ๋„ˆ๋ฌด ์ž‘์Šต๋‹ˆ๋‹ค. Modelfile์—์„œ num_ctx๋ฅผ ์ตœ์†Œ 32768๋กœ ์„ค์ •ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. `PARAMETER num_ctx 32768`๋กœ Modelfile์„ ๋งŒ๋“ค๊ณ  `ollama create qwen3-32k -f Modelfile`์„ ์‹คํ–‰ํ•˜์—ฌ ์˜ฌ๋ฐ”๋ฅธ ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ๊ฐ–์ถ˜ ๋ชจ๋ธ ์ธ์Šคํ„ด์Šค๋ฅผ ๋นŒ๋“œํ•˜์‹ญ์‹œ์˜ค.

Qwen์„ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๋ฉด GDPR์„ ์ค€์ˆ˜ํ•˜๋‚˜์š”?

๋„ค โ€” ๋กœ์ปฌ ์ถ”๋ก ์€ ๊ฐ€๋Šฅํ•œ ๊ฐ€์žฅ GDPR ์ค€์ˆ˜์ ์ธ AI ์•„ํ‚คํ…์ฒ˜์ž…๋‹ˆ๋‹ค. Qwen์ด ์‚ฌ์šฉ์ž์˜ ํ•˜๋“œ์›จ์–ด์—์„œ ์‹คํ–‰๋˜๋ฉด ์–ด๋–ค ์ œ3์ž์—๊ฒŒ๋„ ๋ฐ์ดํ„ฐ๊ฐ€ ์ „์†ก๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ ์ด์ „์ด ์—†๊ธฐ ๋•Œ๋ฌธ์— ๊ตญ์ œ ๋ฐ์ดํ„ฐ ์ด์ „์— ๊ด€ํ•œ GDPR ์ œ44์กฐ ์ œํ•œ์ด ์ ์šฉ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋‚ด๋ถ€ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๊ณ„์•ฝ์ด ์ ์šฉ๋˜์ง€๋งŒ, AI ๋ ˆ์ด์–ด์— ๋Œ€ํ•œ SCC๋‚˜ ์ ์ •์„ฑ ๊ฒฐ์ •์€ ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

Qwen 3๋ฅผ CPU๋งŒ์œผ๋กœ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

๋„ค, GPU ์—†๋Š” ์‹œ์Šคํ…œ์—์„œ llama.cpp ๋˜๋Š” Ollama๋ฅผ ํ†ตํ•ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. CPU ์ถ”๋ก ์€ ์ƒ๋‹นํžˆ ๋А๋ฆฝ๋‹ˆ๋‹ค โ€” Qwen 3.6 27B์˜ ๊ฒฝ์šฐ ์ตœ์‹  CPU์—์„œ ์ผ๋ฐ˜์ ์œผ๋กœ ์ดˆ๋‹น 1โ€“5 ํ† ํฐ์ž…๋‹ˆ๋‹ค. ํ”„๋กœ๋•์…˜ ์‚ฌ์šฉ์˜ ๊ฒฝ์šฐ GPU ๋˜๋Š” Apple Silicon์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ „์šฉ GPU๊ฐ€ ์—†๋Š” ๋…ธํŠธ๋ถ์—์„œ ๊ฐ€๋” ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ํ…Œ์ŠคํŠธํ•˜๋Š” ๊ฒฝ์šฐ CPU ์ถ”๋ก ์€ ์ž‘๋™ํ•˜์ง€๋งŒ ์‹ค์‹œ๊ฐ„ ๋Œ€ํ™”์—๋Š” ๋น„์‹ค์šฉ์ ์ž…๋‹ˆ๋‹ค.

Qwen์„ ์ตœ์‹  ๋ฒ„์ „์œผ๋กœ ์—…๋ฐ์ดํŠธํ•˜๋ ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•˜๋‚˜์š”?

`ollama pull qwen3.6:27b`๋ฅผ ๋‹ค์‹œ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. Ollama๋Š” ์ตœ์‹  ๋ฒ„์ „์ด ์žˆ๋Š”์ง€ ํ™•์ธํ•˜๊ณ  ๋ณ€๊ฒฝ๋œ ๋ ˆ์ด์–ด๋งŒ ๋‹ค์šด๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค. Modelfile์„ ๋‹ค์‹œ ๋งŒ๋“ค ํ•„์š”๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค โ€” ๋ชจ๋ธ ํƒœ๊ทธ(qwen3.6:27b)๋Š” ํ•ญ์ƒ ์ตœ์‹  27B ๋ฆด๋ฆฌ์Šค๋ฅผ ๊ฐ€๋ฆฌํ‚ต๋‹ˆ๋‹ค. LM Studio์—์„œ๋Š” ๋ชจ๋ธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์—์„œ ์—…๋ฐ์ดํŠธ๋ฅผ ํ™•์ธํ•˜๊ณ  ์ตœ์‹  GGUF ๋ฒ„์ „์ด ์žˆ์œผ๋ฉด ์žฌ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค.

Claude Code์™€ ๋กœ์ปฌ Qwen์„ ํ•จ๊ป˜ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

๋„ค. Claude Code๋Š” Claude๋ฅผ ์œ„ํ•œ Anthropic์˜ ์ฝ”๋”ฉ CLI์ž…๋‹ˆ๋‹ค. ๋กœ์ปฌ Qwen 3.6 27B์™€ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜๋ ค๋ฉด ๋ฌด๋ฃŒ Claude Code Proxy๋ฅผ ์„ค์น˜ํ•˜๊ณ  LM Studio ์ธ์Šคํ„ด์Šค(localhost:1234)๋ฅผ ๊ฐ€๋ฆฌํ‚จ ๋‹ค์Œ Claude Code๊ฐ€ ํ”„๋ก์‹œ(localhost:8082)๋ฅผ ํ†ตํ•ด ์š”์ฒญ์„ ๋ผ์šฐํŒ…ํ•˜๋„๋ก ๊ตฌ์„ฑํ•˜์‹ญ์‹œ์˜ค. ์ฝ”๋“œ๋Š” ์™„์ „ํžˆ ๋กœ์ปฌ๋กœ ์œ ์ง€๋ฉ๋‹ˆ๋‹ค โ€” Anthropic API ํ‚ค๊ฐ€ ํ•„์š” ์—†์Šต๋‹ˆ๋‹ค.

๋กœ์ปฌ Qwen๊ณผ ํ•จ๊ป˜ Claude Code๋ฅผ ์‚ฌ์šฉํ•˜๋ ค๋ฉด Anthropic API ํ‚ค๊ฐ€ ํ•„์š”ํ•œ๊ฐ€์š”?

์•„๋‹ˆ์š”. ํ”„๋ก์‹œ๋ฅผ ํ†ตํ•ด ๋กœ์ปฌ LLM๊ณผ ํ•จ๊ป˜ Claude Code๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ๋Š” Anthropic API ํ‚ค๊ฐ€ ์‚ฌ์šฉ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ํ”„๋ก์‹œ๊ฐ€ Claude Code์˜ ์š”์ฒญ์„ ๊ฐ€๋กœ์ฑ„์–ด LM Studio ์„œ๋ฒ„๋กœ ๋ผ์šฐํŒ…ํ•ฉ๋‹ˆ๋‹ค. API ํ‚ค๋Š” ๋ณ‘๋ ฌ๋กœ Anthropic์˜ Claude API๋ฅผ ๋‹ค๋ฅธ ์ž‘์—…์— ์‚ฌ์šฉํ•˜๋ ค๋Š” ๊ฒฝ์šฐ์—๋งŒ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

Claude Code Proxy์™€ Ollama์˜ ์ฐจ์ด์ ์€ ๋ฌด์—‡์ธ๊ฐ€์š”?

Ollama๋Š” ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ, ์–‘์žํ™”, ์ปจํ…์ŠคํŠธ ๊ตฌ์„ฑ์„ ๊ด€๋ฆฌํ•˜๊ณ  OpenAI ํ˜ธํ™˜ API(localhost:11434/v1)๋ฅผ ๋…ธ์ถœํ•˜๋Š” ๋กœ์ปฌ LLM ๋Ÿฐํƒ€์ž„์ž…๋‹ˆ๋‹ค. Claude Code Proxy๋Š” Claude Code๋ฅผ ๋กœ์ปฌ LLM(Ollama, LM Studio, ๋˜๋Š” llama.cpp)์— ์—ฐ๊ฒฐํ•˜๋Š” ๊ฒฝ๋Ÿ‰ ๋ธŒ๋ฆฌ์ง€์ž…๋‹ˆ๋‹ค. ๋‘ ๊ฐ€์ง€๋ฅผ ๋™์‹œ์— ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค: Ollama๋Š” ๋ชจ๋ธ์„ ์ฒ˜๋ฆฌํ•˜๊ณ , ํ”„๋ก์‹œ๋Š” Claude Code ํด๋ผ์ด์–ธํŠธ ์—ฐ๊ฒฐ์„ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ๋˜๋Š” Ollama ๋Œ€์‹  LM Studio๋ฅผ ๋Ÿฐํƒ€์ž„์œผ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค โ€” ํ”„๋ก์‹œ๋Š” ๋‘ ๊ฐ€์ง€ ๋ชจ๋‘์™€ ํ˜ธํ™˜๋ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ Qwen๊ณผ Claude Code๋ฅผ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜๋ฉด ์ถ”๋ก  ์†๋„์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋‚˜์š”?

ํฐ ์˜ํ–ฅ ์—†์Šต๋‹ˆ๋‹ค. ํ”„๋ก์‹œ๋Š” LM Studio ์ธ์Šคํ„ด์Šค์™€ ๊ฐ™์€ ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰๋˜๋ฏ€๋กœ ๋ฌด์‹œํ•  ์ˆ˜ ์žˆ๋Š” ์ง€์—ฐ(50ms ๋ฏธ๋งŒ)๋งŒ ์ถ”๊ฐ€๋ฉ๋‹ˆ๋‹ค. ์ถ”๋ก  ์†๋„๋Š” ํ”„๋ก์‹œ๊ฐ€ ์•„๋‹Œ GPU์™€ ๋ชจ๋ธ ์–‘์žํ™”(Q4_K_M์ด ํ‘œ์ค€)์— ์˜ํ•ด ๊ฒฐ์ •๋ฉ๋‹ˆ๋‹ค. ์ฝ”๋“œ ์ƒ์„ฑ ์ž‘์—…์˜ ์ „์ฒด ์ถ”๋ก  ์‘๋‹ต ์‹œ๊ฐ„์€ ์ถœ๋ ฅ ๊ธธ์ด์— ๋”ฐ๋ผ RTX 4080์—์„œ ์ผ๋ฐ˜์ ์œผ๋กœ 20โ€“60์ดˆ์ž…๋‹ˆ๋‹ค.

Qwen์ด ๋กœ์ปฌ์—์„œ ์‹คํ–‰ ์ค‘์ž…๋‹ˆ๋‹ค. ์ด์ œ ๋” ์œ ์šฉํ•˜๊ฒŒ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์ตœ๊ณ ์˜ UI๋ฅผ ์‚ดํŽด๋ณด์‹ญ์‹œ์˜ค.

2026๋…„ ์ตœ๊ณ ์˜ ๋กœ์ปฌ LLM ํ”„๋ก ํŠธ์—”๋“œ โ†’

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

PromptQuorum ๋Œ€๊ธฐ์ž ๋ช…๋‹จ ๋“ฑ๋ก โ†’

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

2026 Qwen 3 ๋กœ์ปฌ ์‹คํ–‰: Ollama & LM Studio ์„ค์ • ๊ฐ€์ด๋“œ | PromptQuorum