Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/2026๋…„ Ollama ์ตœ๊ณ  ์˜คํ”ˆ์†Œ์Šค LLM 10์„  (์ˆœ์œ„ ๋ฐ ํ…Œ์ŠคํŠธ)
Best Models

2026๋…„ Ollama ์ตœ๊ณ  ์˜คํ”ˆ์†Œ์Šค LLM 10์„  (์ˆœ์œ„ ๋ฐ ํ…Œ์ŠคํŠธ)

ยท9๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—์„œ ๊ฐ€์žฅ ์šฐ์ˆ˜ํ•œ ์ „๋ฐ˜์  ๋ชจ๋ธ์€ Qwen 3.6 27B(77.2% SWE-bench, Q4์—์„œ 24GB์— ์ ํ•ฉ)์ž…๋‹ˆ๋‹ค. ๊ธฐํƒ€ ์ถ”์ฒœ ๋ชจ๋ธ: Kimi K2.6(์ตœ์ „์„  ์ฝ”๋”ฉ), gpt-oss:20b(์†Œํ˜• ์ตœ๊ฐ• / 16GB), qwen3:30b(๊ท ํ˜•์žกํžŒ ๋ฒ”์šฉ), DeepSeek-R1(์ถ”๋ก ), Gemma 4(๋น„์ „/๋„๊ตฌ ํ˜ธ์ถœ), Llama 4 Scout(10M ๊ธด ์ปจํ…์ŠคํŠธ / ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ). ์ „์ฒด ๋‹ค์šด๋กœ๋“œ ์ตœ๋‹ค๋Š” ์—ฌ์ „ํžˆ Llama ๊ณ„์—ด์ž…๋‹ˆ๋‹ค. 2026๋…„ ์‹ ๊ทœ: Kimi K2.6, Qwen 3.6 27B, GLM-5.1, gpt-oss.

2026๋…„ Ollama์—์„œ ๊ฐ€์žฅ ๋งŽ์ด ๋‹ค์šด๋กœ๋“œ๋œ ๋ชจ๋ธ์€ Llama 4 Scout์™€ Llama 3.x(์ „์ฒด ์ตœ๋‹ค ์ธ๊ธฐ), Qwen3(๊ฐ€์žฅ ๋น ๋ฅธ ์„ฑ์žฅ์„ธ, ์ตœ๊ณ  ์ฝ”๋”ฉ ์„ฑ๋Šฅ), Gemma 4(์—์ด์ „ํŠธ ๋ฐ ๋„๊ตฌ ํ˜ธ์ถœ ์ตœ์ ), Mistral(๊ฐ€์žฅ ํšจ์œจ์ ), DeepSeek-R1(์ตœ๊ณ  ์ถ”๋ก  ๋Šฅ๋ ฅ)์ž…๋‹ˆ๋‹ค. 2026๋…„ 5์›” ์‹ ๊ทœ ์ถ”๊ฐ€: Kimi K2.6(MoE, MIT ๋ผ์ด์„ ์Šค, ์ตœ์ƒ์œ„ ์ฝ”๋”ฉ), Qwen 3.6(77.2% SWE-bench), GLM-5.1.

Key Takeaways

  • ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด ์ „๋ฐ˜ ์ตœ๊ณ : Qwen 3.6 27B(77.2% SWE-bench, Q4์—์„œ 24GB์— ์ ํ•ฉ). ๊ท ํ˜•์žกํžŒ ๋ฒ”์šฉ: qwen3:30b.
  • ๋‹ค์šด๋กœ๋“œ ์ตœ๋‹ค: Llama 3.2 3B(ํŠœํ† ๋ฆฌ์–ผ์šฉ)์™€ Llama ๊ณ„์—ด -- ๊ฐ€์žฅ ๋„“์€ ๋„๊ตฌ ์ง€์›.
  • ์ถ”๋ก  ์ตœ๊ณ : DeepSeek-R1(์—ฐ์‡„ ์‚ฌ๊ณ )๊ณผ gpt-oss:20b(์กฐ์ • ๊ฐ€๋Šฅํ•œ ์ถ”๋ก , ~o3-mini ์ˆ˜์ค€).
  • ์ฝ”๋”ฉ ์ตœ๊ณ : Kimi K2.6(์ตœ์ „์„  MoE), Qwen 3.6 27B(์ตœ๊ณ  ๋ฐ€์ง‘ ๋ชจ๋ธ), Devstral Small 24B(์ตœ๊ณ  ์—์ด์ „ํŠธ ์ฝ”๋”ฉ), qwen3-coder:30b(์ฝ”๋“œ ์™„์„ฑ) -- ํ•ด๋‹น ํฌ๊ธฐ์—์„œ ๊ฐ€์žฅ ๋†’์€ ๋ฒค์น˜๋งˆํฌ.
  • ์†Œํ˜• ์ตœ๊ฐ• / 16GB: gpt-oss:20b. ๋น„์ „/๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ตœ๊ณ : Gemma 4(E4B+). ๊ธด ์ปจํ…์ŠคํŠธ(10M) / ๋Œ€ํ˜• ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ์ตœ๊ณ : Llama 4 Scout(~55GB).
  • 2026๋…„ 6์›” ๊ธฐ์ค€, Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์—๋Š” 4,500๊ฐœ ์ด์ƒ์˜ ๋ชจ๋ธ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋“  ๋ชจ๋ธ์€ `ollama pull <name>`์œผ๋กœ ์ด์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

Ollama ์‹ ๊ทœ ์†Œ์‹ โ€” 2026๋…„ 6์›” ์—…๋ฐ์ดํŠธ

ํ˜„์žฌ Ollama ๋ฒ„์ „: v0.24.0(2026๋…„ 5์›” 14์ผ ์ถœ์‹œ). ollama.com/download์—์„œ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ์ตœ์‹  ์•ˆ์ • ๋ฆด๋ฆฌ์Šค์ž…๋‹ˆ๋‹ค.

์ตœ์‹  ๋ฆด๋ฆฌ์Šค(2026๋…„ 5์›” 14์ผ): Ollama v0.24.0์€ ์‚ฌ๊ณ  ๊ธฐ๋Šฅ๊ณผ ๋„๊ตฌ ํ˜ธ์ถœ ๊ธฐ๋Šฅ์„ ๊ฐ–์ถ˜ Gemma 4 ์ „์ฒด ์ง€์›์„ ์ถ”๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฒˆ ๋ฆด๋ฆฌ์Šค์—๋Š” ๊ฐœ์„ ๋œ ์–‘์žํ™” ์ฒ˜๋ฆฌ์™€ ๋ชจ๋ธ ์ถ”๋ก  ์ตœ์ ํ™”๊ฐ€ ํฌํ•จ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ž์„ธํ•œ ๋ฆด๋ฆฌ์Šค ๋…ธํŠธ๋Š” github.com/ollama/ollama/releases์—์„œ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

์‹ ๊ทœ ์ถ”๊ฐ€ ๋ชจ๋ธ(2026๋…„ 5~6์›”):

  • Kimi K2.6(Moonshot AI, 2026๋…„ 4์›” 20์ผ) โ€” ์ตœ์ „์„  ์ฝ”๋”ฉ ๋ชจ๋ธ, SWE-Bench Pro 58.6(GPT-5.5์™€ ๋™์ ). MoE ์•„ํ‚คํ…์ฒ˜(32B ํ™œ์„ฑ / 1T ์ „์ฒด). Modified MIT ๋ผ์ด์„ ์Šค. Pull: `ollama pull kimi-k2.6`
  • Qwen 3.6 27B(Alibaba, 2026๋…„ 4์›” 16์ผ) โ€” ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด ์ „๋ฐ˜ ์ตœ๊ณ , 77.2% SWE-bench, Apache 2.0, Q4์—์„œ 24GB์— ์ ํ•ฉ. ๋˜ํ•œ Qwen3.6-35B-A3B(MoE, 73.4 SWE-bench)๋„ ์žˆ์Šต๋‹ˆ๋‹ค. Pull: `ollama pull qwen3.6:27b`
  • GLM-5.1(Z.ai, 2026๋…„ 4์›” 7์ผ) โ€” 744B / 40B ํ™œ์„ฑ MoE, MIT ๋ผ์ด์„ ์Šค, SWE-Bench Pro 58.4. ๊ตฌ์กฐํ™”๋œ ์ฝ”๋“œ ์ƒ์„ฑ ๋ถ„์•ผ ์„ ๋‘. Pull: `ollama pull glm-5.1`
  • gpt-oss(OpenAI, 2026๋…„) โ€” ์˜คํ”ˆ ์›จ์ดํŠธ MoE: gpt-oss:20b(21B ์ „์ฒด / 3.6B ํ™œ์„ฑ, 16GB์—์„œ ์‹คํ–‰, ~o3-mini ์ˆ˜์ค€, ์กฐ์ • ๊ฐ€๋Šฅํ•œ ์ถ”๋ก )์™€ gpt-oss:120b(80GB). Pull: `ollama pull gpt-oss:20b`
  • Gemma 4(Google, 2026๋…„ 4์›” 2์ผ) โ€” ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํฌ๊ธฐ E2B / E4B / E12B(26B MoE) / E27B(31B ๋ฐ€์ง‘), ๋ชจ๋‘ ๋น„์ „๊ณผ ๋„๊ตฌ ํ˜ธ์ถœ ์ง€์›. E4B๋Š” ~6GB VRAM์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. Pull: `ollama pull gemma4:e4b`
bash
# Ollama๋ฅผ ์ตœ์‹  ๋ฒ„์ „์œผ๋กœ ์—…๋ฐ์ดํŠธ
curl https://ollama.ai/install.sh | sh

# ๋˜๋Š” Mac์—์„œ: brew upgrade ollama

# ํ˜„์žฌ ๋ฒ„์ „ ํ™•์ธ
ollama --version  # ์ถœ๋ ฅ: ollama version 0.24.0

# ์ตœ์‹  ์‹ ๊ทœ ๋ชจ๋ธ Pull
ollama pull kimi-k2.6
ollama pull qwen3.6:27b
ollama pull glm-5.1

์‚ฌ์šฉ ์‚ฌ๋ก€๋ณ„๋กœ ๊ฐ€์žฅ ์ ํ•ฉํ•œ Ollama ๋ชจ๋ธ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

๋ชจ๋ธ ์ถœ๋ ฅ ํ’ˆ์งˆ์€ ํ”„๋กฌํ”„ํŠธ ๋ฐฉ์‹์— ํฌ๊ฒŒ ์˜์กดํ•ฉ๋‹ˆ๋‹ค. ์—ฐ์‡„ ์‚ฌ๊ณ , ํ“จ์ƒท ์˜ˆ์‹œ, ์ถœ๋ ฅ ํ˜•์‹ ์ง€์ • ๋“ฑ ๋ชจ๋“  ๋กœ์ปฌ ๋ชจ๋ธ์—์„œ ์ž‘๋™ํ•˜๋Š” ๊ตฌ์กฐํ™”๋œ ๊ธฐ๋ฒ•์€ ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง ๊ฐ€์ด๋“œ๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค. ์ถ”๋ก  ์ž‘์—…์—์„œ๋Š” ์—ฐ์‡„ ์‚ฌ๊ณ  ํ”„๋กฌํ”„ํŒ…์ด DeepSeek-R1 ๋ฐ Qwen3 ์ถœ๋ ฅ ํ’ˆ์งˆ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์˜ ์–‘์žํ™” ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๋ฅผ ์ดํ•ดํ•˜๋ ค๋ฉด ์–‘์žํ™” ๊ฐ€์ด๋“œ โ†’๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค. ๊ฐ ๋ชจ๋ธ์— ํ•„์š”ํ•œ VRAM ์–‘์„ ํ™•์ธํ•˜๋ ค๋ฉด VRAM ์š”๊ตฌ ์‚ฌํ•ญ ๊ฐ€์ด๋“œ โ†’๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค. Gemma 4๋ฅผ ์‚ฌ์šฉํ•œ ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์— ๋Œ€ํ•ด์„œ๋Š” ํŠธ๋ฆฌ ์˜ค๋ธŒ ์†ŒํŠธ ๋ฐ ReAct๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค. ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•˜๊ธฐ ์œ„ํ•œ ํ•˜๋“œ์›จ์–ด ์š”๊ตฌ ์‚ฌํ•ญ์€ ํ•˜๋“œ์›จ์–ด ๊ฐ€์ด๋“œ โ†’๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค. ์ด ๋ชฉ๋ก์˜ ๋„๊ตฌ ํ˜ธ์ถœ ๋ชจ๋ธ์ด ํŒŒ์ผ ๋ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์•ก์„ธ์Šค์™€ ํ•จ๊ป˜ ๋‹ค๋‹จ๊ณ„ ๋ฃจํ”„์— ์—ฐ๊ฒฐ๋˜๋ฉด ์˜คํ”ˆ์†Œ์Šค ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜ ํŒจํ„ด์— ๋Œ€ํ•ด MCP๋ฅผ ํ™œ์šฉํ•œ ๋กœ์ปฌ AI ์—์ด์ „ํŠธ๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

  • ์ผ๋ฐ˜ ์ฑ„ํŒ…(์ž…๋ฌธ): `ollama run llama3.2:3b` -- ๋ฌธ์„œ๊ฐ€ ๊ฐ€์žฅ ๋งŽ๊ณ  ์ฒซ ๋ฒˆ์งธ ๋ชจ๋ธ๋กœ ์ตœ์  ์ง€์›.
  • ์ผ๋ฐ˜ ์ฑ„ํŒ…(์ „๋ฐ˜ ์ตœ๊ณ ): `ollama run qwen3.6:27b` -- 77.2% SWE-bench, ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด ์ „๋ฐ˜ ์ตœ๊ณ , Q4์—์„œ 24GB์— ์ ํ•ฉ. ๊ท ํ˜•์žกํžŒ ๋ฒ”์šฉ: `ollama run qwen3:30b`. 8GB ๊ธฐ๊ธฐ์—์„œ๋Š” `ollama run llama3.2:3b`๋ฅผ ์œ ์ง€ํ•˜์‹ญ์‹œ์˜ค.
  • ๊ธด ์ปจํ…์ŠคํŠธ / ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ: `ollama run llama4:scout` -- 1,000๋งŒ ํ† ํฐ ์ปจํ…์ŠคํŠธ + ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ, MoE(17B ํ™œ์„ฑ/109B ์ „์ฒด). Q4์—์„œ ~55GB VRAM ํ•„์š”(1.78๋น„ํŠธ์—์„œ๋งŒ 24GB์— ์ ํ•ฉ, ~20 tok/s).
  • ์†Œํ˜• ์ตœ๊ฐ• / 16GB: `ollama run gpt-oss:20b` -- 21B ์ „์ฒด / 3.6B ํ™œ์„ฑ MoE, ~o3-mini ์ˆ˜์ค€, ์กฐ์ • ๊ฐ€๋Šฅํ•œ ์ถ”๋ก . ๋” ํฐ ๋ชจ๋ธ: `ollama run gpt-oss:120b`(80GB).
  • 8GB์—์„œ ์ฝ”๋”ฉ: `ollama run qwen3:8b` -- 8GB VRAM ๊ธฐ๊ธฐ ์ตœ๊ณ  ๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ. 76% HumanEval, 5GB ์‚ฌ์šฉ, ๋‹ค๊ตญ์–ด ์ง€์›.
  • 8GB์—์„œ ์ผ๋ฐ˜ ์ถ”๋ก (์ฝ”๋”ฉ ์™ธ): `ollama run mistral:7b` -- 8GB์—์„œ ๊ฐ€์žฅ ๋น ๋ฅธ ๋ฒ”์šฉ ๋ชจ๋ธ, 40~60 tok/sec.
  • ์ฝ”๋”ฉ(์ตœ๊ณ  ์—์ด์ „ํŠธ, 24B): `ollama run devstral-small:24b` -- ์ตœ๊ณ  ์—์ด์ „ํŠธ ์ฝ”๋”ฉ ๋ชจ๋ธ(๋‹ค์ค‘ ํŒŒ์ผ ํŽธ์ง‘, ๋””๋ฒ„๊น…). 16GB RAM. Mistral AI ์ œ๊ณต.
  • ์ฝ”๋”ฉ(์ตœ๊ณ  ๋ฐ€์ง‘, 27B): `ollama run qwen3.6:27b` -- 77.2% SWE-bench. ์ตœ๊ณ  ๋ฐ€์ง‘ ์ฝ”๋”ฉ ๋ชจ๋ธ. 22GB VRAM.
  • ์ฝ”๋”ฉ(์ตœ์ „์„  MoE): `ollama run kimi-k2.6` -- SWE-Bench Pro 58.6(GPT-5.5 ๋™์ ), ์ตœ์ƒ์œ„. MoE(32B ํ™œ์„ฑ/1T ์ „์ฒด). Modified MIT ๋ผ์ด์„ ์Šค. ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—๋Š” ์–‘์žํ™” ํ•„์š”.
  • ์—์ด์ „ํŠธ ์ž‘์—… ๋ฐ ๋„๊ตฌ ํ˜ธ์ถœ: `ollama run gemma4:e4b` -- 2026๋…„ 4์›” 2์ผ ์ถœ์‹œ. ๋‚ด์žฅ ๋„๊ตฌ ํ˜ธ์ถœ + ๋น„์ „ ์ง€์›. ๋กœ์ปฌ ์—์ด์ „ํŠธ, ํ•จ์ˆ˜ ํ˜ธ์ถœ, ๊ตฌ์กฐํ™”๋œ ์ถœ๋ ฅ์— ๊ถŒ์žฅ. 6GB RAM.
  • ์ถ”๋ก  ๋ฐ ์ˆ˜ํ•™: `ollama run deepseek-r1:7b` -- ์—ฐ์‡„ ์‚ฌ๊ณ  ๋ชจ๋ธ, 7B์—์„œ ์ตœ๊ณ  ๋กœ์ปฌ ์ˆ˜ํ•™ ์„ฑ๋Šฅ.
  • ๋‹ค๊ตญ์–ด: `ollama run qwen3:7b` -- 29๊ฐœ ์ด์ƒ ์–ธ์–ด ๊ธฐ๋ณธ ์ง€์›, ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ๋น„์˜์–ด ์ง€์›, 76% HumanEval.
  • ์ด๋ฏธ์ง€ ์ดํ•ด: `ollama run gemma4:e4b` -- ๋น„์ „ + ๋„๊ตฌ ํ˜ธ์ถœ(2026๋…„ 6์›”). ๋˜๋Š” ์ „์šฉ ๋น„์ „์šฉ `ollama run llama3.2-vision:11b`.
  • ๋น ๋ฅด๊ณ  ๊ฒฝ๋Ÿ‰: `ollama run gemma2:2b` -- ๊ฐ€์žฅ ๋น ๋ฅธ CPU ์ถ”๋ก , 1.7GB RAM.
  • ๊ณ ํ’ˆ์งˆ(16GB RAM): `ollama run mistral-small3.1` -- 14GB RAM์—์„œ ~70B๊ธ‰ ํ’ˆ์งˆ.
  • ์ž„๋ฒ ๋”ฉ ์ƒ์„ฑ: `ollama run nomic-embed-text` -- RAG ํŒŒ์ดํ”„๋ผ์ธ์šฉ 1์–ต 3,700๋งŒ ํŒŒ๋ผ๋ฏธํ„ฐ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ.
  • ๋ฌธ์„œ Q&A(RAG): Open WebUI์˜ RAG ๊ธฐ๋Šฅ๊ณผ ํ•จ๊ป˜ `ollama run llama3.2` -- ๊ฐ€์žฅ ์ž˜ ์ง€์›๋˜๋Š” ์กฐํ•ฉ.
  • ํ™ˆ ์ž๋™ํ™” / ์›จ์ดํฌ ์›Œ๋“œ AI: `ollama run phi4-mini` โ€” Phi-4 Mini(3.8B, ~3GB VRAM)๋Š” ๋…๋ฆฝ GPU ์—†์ด ๋ฏธ๋‹ˆ PC์—์„œ 20~25 tok/sec๋กœ Home Assistant ์Œ์„ฑ ์ฟผ๋ฆฌ๋ฅผ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. Home Assistant + Ollama ํ†ตํ•ฉ ๊ฐ€์ด๋“œ โ†’ ์ฐธ์กฐ.
์‚ฌ์šฉ ์‚ฌ๋ก€๋ณ„ Ollama ๋ชจ๋ธ ์„ ํƒ: ์ฑ„ํŒ…๊ณผ ์ฝ”๋”ฉ์—๋Š” qwen3.6:27b(์ „๋ฐ˜ ์ตœ๊ณ , 77.2% SWE-bench), ์ตœ์ „์„  ์ฝ”๋”ฉ์—๋Š” kimi-k2.6, 16GB์—์„œ๋Š” gpt-oss:20b, ์ˆ˜ํ•™์—๋Š” deepseek-r1:7b.
์‚ฌ์šฉ ์‚ฌ๋ก€๋ณ„ Ollama ๋ชจ๋ธ ์„ ํƒ: ์ฑ„ํŒ…๊ณผ ์ฝ”๋”ฉ์—๋Š” qwen3.6:27b(์ „๋ฐ˜ ์ตœ๊ณ , 77.2% SWE-bench), ์ตœ์ „์„  ์ฝ”๋”ฉ์—๋Š” kimi-k2.6, 16GB์—์„œ๋Š” gpt-oss:20b, ์ˆ˜ํ•™์—๋Š” deepseek-r1:7b.

์‹ ๊ทœ Ollama ๋ชจ๋ธ โ€” 2026๋…„ 6์›” ๋ฆด๋ฆฌ์Šค

์›Œํฌํ”Œ๋กœ๋ฅผ ๊ตฌ์ถ•ํ•˜๊ธฐ ์ „์— `ollama pull <model>`๋กœ ๊ฐ€์šฉ์„ฑ์„ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ์ƒˆ ๋ชจ๋ธ์€ ์ถœ์‹œ ํ›„ ๋ฉฐ์น  ๋‚ด์— ollama.com/library์˜ Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์— ๋“ฑ์žฅํ•ฉ๋‹ˆ๋‹ค.

ModelReleasedBest ForOllama Command
kimi-k2.62026๋…„ 4์›” 20์ผ์ตœ์ „์„  ์ฝ”๋”ฉ(SWE-Bench Pro 58.6), MoE(32B/1T), Modified MITollama run kimi-k2.6
qwen3.6:27b2026๋…„ 4์›” 16์ผ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด ์ „๋ฐ˜ ์ตœ๊ณ , 77.2% SWE-bench, Q4์—์„œ 24GB ์ ํ•ฉollama run qwen3.6:27b
qwen3:30b2026๋…„๊ท ํ˜•์žกํžŒ ๋ฒ”์šฉ; ์ฝ”๋“œ ์™„์„ฑ์—๋Š” qwen3-coder:30bollama run qwen3:30b
gpt-oss:20b2026๋…„์†Œํ˜• ์ตœ๊ฐ• / 16GB, ~o3-mini, ์กฐ์ • ๊ฐ€๋Šฅํ•œ ์ถ”๋ก (gpt-oss:120b๋„ ์žˆ์Œ)ollama run gpt-oss:20b
glm-5.12026๋…„ 4์›” 7์ผZ.ai, 744B/40B ํ™œ์„ฑ MoE, MIT, SWE-Bench Pro 58.4ollama run glm-5.1
gemma4:e4b2026๋…„ 4์›” 2์ผ๋น„์ „ + ๋„๊ตฌ ํ˜ธ์ถœ(E2B/E4B/E12B/E27B)ollama run gemma4:e4b
deepseek-v4-flash2026๋…„ 4~5์›”์ €๋น„์šฉ ์ฝ”๋”ฉ(์‹ค์„ธ๊ณ„ 78/100)ollama run deepseek-v4-flash
qwen3:7b2026๋…„7B์—์„œ HumanEval 76%, ๋‹ค๊ตญ์–ดollama run qwen3:7b

DeepSeek-R1์ด๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์–ด๋–ป๊ฒŒ ๋‹ค๋ฆ…๋‹ˆ๊นŒ?

DeepSeek-R1์€ ์ถ”๋ก  ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค -- ๋‹ต๋ณ€์„ ์ง์ ‘ ์ƒ์„ฑํ•˜๋Š” ํ‘œ์ค€ ์ฑ„ํŒ… ๋ชจ๋ธ๊ณผ ๋‹ฌ๋ฆฌ, DeepSeek-R1์€ ์ตœ์ข… ๋‹ต๋ณ€ ์ „์— ๋ช…์‹œ์ ์ธ ์—ฐ์‡„ ์‚ฌ๊ณ  ์ถ”๋ก ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ˆ˜ํ•™, ๋…ผ๋ฆฌ ํผ์ฆ, ๋‹จ๊ณ„๋ณ„ ๋ฌธ์ œ ํ•ด๊ฒฐ์—์„œ ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค.

DeepSeek-R1 7B๋Š” ๊ฒฝ์Ÿ ์ˆ˜ํ•™(MATH)์—์„œ 52%๋ฅผ ๊ธฐ๋กํ•˜๋Š” ๋ฐ˜๋ฉด, ๊ฐ™์€ ํฌ๊ธฐ์˜ Mistral Small์€ 28%์— ๊ทธ์นฉ๋‹ˆ๋‹ค. ํ‘œ์ค€ ๋ชจ๋ธ๋ณด๋‹ค ๋А๋ฆฌ์ง€๋งŒ(์‘๋‹ต๋‹น ํ† ํฐ ์ˆ˜๊ฐ€ ๋งŽ์Œ) ์ถ”๋ก ์ด ์ค‘์š”ํ•œ ์ž‘์—…์—์„œ ํ›จ์”ฌ ๋” ์ •ํ™•ํ•ฉ๋‹ˆ๋‹ค.

bash
# DeepSeek-R1 Pull ๋ฐ ์‹คํ–‰
ollama run deepseek-r1:7b

# ๋” ๋‚˜์€ ํ’ˆ์งˆ์„ ์œ„ํ•œ ๋Œ€ํ˜• ๋ณ€ํ˜•
ollama run deepseek-r1:14b   # 10GB RAM
ollama run deepseek-r1:32b   # 20GB RAM
DeepSeek-R1 7B vs Mistral Small: MATH์—์„œ 52% vs 28%. ์—ฐ์‡„ ์‚ฌ๊ณ  ์ถ”๋ก  ๋ชจ๋ธ -- ๋” ๋А๋ฆฌ์ง€๋งŒ ์ •ํ™•๋„๊ฐ€ ํฌ๊ฒŒ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค.
DeepSeek-R1 7B vs Mistral Small: MATH์—์„œ 52% vs 28%. ์—ฐ์‡„ ์‚ฌ๊ณ  ์ถ”๋ก  ๋ชจ๋ธ -- ๋” ๋А๋ฆฌ์ง€๋งŒ ์ •ํ™•๋„๊ฐ€ ํฌ๊ฒŒ ํ–ฅ์ƒ๋ฉ๋‹ˆ๋‹ค.

Ollama ๋ชจ๋ธ ์ค‘ ์ด๋ฏธ์ง€ ์ž…๋ ฅ์„ ์ง€์›ํ•˜๋Š” ๋ชจ๋ธ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

2026๋…„ 6์›” ๊ธฐ์ค€, Ollama์—์„œ ์ด๋ฏธ์ง€ ์ž…๋ ฅ(๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ)์„ ์ง€์›ํ•˜๋Š” ๋ชจ๋ธ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค: Gemma 4๋Š” ๋น„์ „๊ณผ ๋„๊ตฌ ํ˜ธ์ถœ์„ ๋ชจ๋‘ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค โ€” Ollama์˜ ๋น„์ „ ๋ชจ๋ธ ์ค‘ ์œ ์ผํ•ฉ๋‹ˆ๋‹ค.

ModelRAMImage SupportOllama Command
llama3.2-vision:11b~8GB์˜ˆollama run llama3.2-vision:11b
llama3.2-vision:90b~55GB์˜ˆollama run llama3.2-vision:90b
gemma3:9b (vision)~6GB์˜ˆollama run gemma3:9b
minicpm-v:8b~5.5GB์˜ˆollama run minicpm-v
gemma4:e4b~6GB์˜ˆ + ๋„๊ตฌ ํ˜ธ์ถœ โœ“ollama run gemma4:e4b
์ด๋ฏธ์ง€ ์ž…๋ ฅ์„ ์œ„ํ•œ Ollama ๋น„์ „ ๋ชจ๋ธ 5๊ฐœ. Gemma 4 E4B(6GB)๋Š” ์ด์ œ ๋„๊ตฌ ํ˜ธ์ถœ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์ „์šฉ ๋น„์ „์—๋Š” Llama 3.2 Vision 11B(8GB). ๋ชจ๋‘ ๋กœ์ปฌ์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.
์ด๋ฏธ์ง€ ์ž…๋ ฅ์„ ์œ„ํ•œ Ollama ๋น„์ „ ๋ชจ๋ธ 5๊ฐœ. Gemma 4 E4B(6GB)๋Š” ์ด์ œ ๋„๊ตฌ ํ˜ธ์ถœ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ์ „์šฉ ๋น„์ „์—๋Š” Llama 3.2 Vision 11B(8GB). ๋ชจ๋‘ ๋กœ์ปฌ์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.

Ollama ์ตœ๊ณ  ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ 10๊ฐœ๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

ํŠœํ† ๋ฆฌ์–ผ์ด ๋งŽ์•„ Llama 3.x์˜ ๋‹ค์šด๋กœ๋“œ ์ˆ˜๋Š” ์—ฌ์ „ํžˆ ๋†’์Šต๋‹ˆ๋‹ค. 2026๋…„ 6์›” ์‹ ๊ทœ ํ”„๋กœ์ ํŠธ์—๋Š” Qwen 3.6 27B(์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด ์ „๋ฐ˜ ์ตœ๊ณ ), Kimi K2.6, gpt-oss:20b, qwen3:30b๋ฅผ ๊ถŒ์žฅํ•ฉ๋‹ˆ๋‹ค.

#ModelBest ForRAMHumanEval
1Qwen 3.6 27B์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด ์ „๋ฐ˜ ์ตœ๊ณ 24GB (Q4)77.2% SWE-bench
2Kimi K2.6์ตœ์ „์„  ์ฝ”๋”ฉ, MoE(32B/1T), Modified MIT์–‘์žํ™”58.6 SWE-Bench Pro
3gpt-oss:20b์†Œํ˜• ์ตœ๊ฐ• / 16GB, ์กฐ์ • ๊ฐ€๋Šฅํ•œ ์ถ”๋ก 16GB~o3-mini
4qwen3:30b๊ท ํ˜•์žกํžŒ ๋ฒ”์šฉ; ์ฝ”๋“œ์—๋Š” qwen3-coder:30b~18GB๊ฐ•๋ ฅ
5Devstral Small 24B์—์ด์ „ํŠธ ์ฝ”๋”ฉ(๋‹ค์ค‘ ํŒŒ์ผ)16GB80%
6deepseek-r1:7b์ถ”๋ก , ์ˆ˜ํ•™5GBโ€”
7gemma4:e4b๋น„์ „ + ๋„๊ตฌ ํ˜ธ์ถœ(๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ)~6GBโ€”
8Llama 4 Scout๊ธด ์ปจํ…์ŠคํŠธ 10M + ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ, MoE~55GB (Q4)85%
9mistral-small3.116GB์—์„œ ๊ณ ํ’ˆ์งˆ14GB74%
10Llama 3.2 3B์ฒซ ๋ฒˆ์งธ ๋ชจ๋ธ, ์ผ๋ฐ˜ ์ฑ„ํŒ…2.5GB60%
2026๋…„ 6์›” ์ƒ์œ„ Ollama ๋ชจ๋ธ: Qwen 3.6 27B(์ „๋ฐ˜ ์ตœ๊ณ , Q4์—์„œ 24GB), Kimi K2.6, gpt-oss:20b. 1,000๋งŒ ํ† ํฐ ์ปจํ…์ŠคํŠธ์—๋Š” Llama 4 Scout(~55GB).
2026๋…„ 6์›” ์ƒ์œ„ Ollama ๋ชจ๋ธ: Qwen 3.6 27B(์ „๋ฐ˜ ์ตœ๊ณ , Q4์—์„œ 24GB), Kimi K2.6, gpt-oss:20b. 1,000๋งŒ ํ† ํฐ ์ปจํ…์ŠคํŠธ์—๋Š” Llama 4 Scout(~55GB).

Ollama ๋ชจ๋ธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์–ด๋–ป๊ฒŒ ํƒ์ƒ‰ํ•ฉ๋‹ˆ๊นŒ?

Ollama ๋ชจ๋ธ์„ ํ™œ์šฉํ•˜๋Š” ๋‘ ๊ฐ€์ง€ ๋ฐฉ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์„ค์น˜๋œ ๋ชจ๋ธ ์ „ํ™˜: Ollama Mac ์•ฑ์—์„œ ์ฑ„ํŒ… ์ž…๋ ฅ์ฐฝ ํ•˜๋‹จ์˜ ๋ชจ๋ธ ๋“œ๋กญ๋‹ค์šด ๋ฒ„ํŠผ(ํ˜„์žฌ ๋ชจ๋ธ ์ด๋ฆ„ ํ‘œ์‹œ, ์˜ˆ: "gemma3:1b")์„ ํด๋ฆญํ•˜์—ฌ ๋กœ์ปฌ์— ์„ค์น˜๋œ ๋ชจ๋ธ ๊ฐ„์— ์ „ํ™˜ํ•ฉ๋‹ˆ๋‹ค. ์ƒˆ ๋ชจ๋ธ ์ฐพ๊ธฐ ๋ฐ ๋‹ค์šด๋กœ๋“œ: ollama.com/library๋ฅผ ๋ฐฉ๋ฌธํ•˜์—ฌ ์นดํ…Œ๊ณ ๋ฆฌ๋ณ„๋กœ 4,500๊ฐœ ์ด์ƒ์˜ ๋ชจ๋ธ์„ ํƒ์ƒ‰ํ•œ ํ›„, ์•„๋ž˜ CLI ๋ช…๋ น์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์„ Pullํ•˜๊ณ  ๊ด€๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

bash
# ๋กœ์ปฌ์— ๋‹ค์šด๋กœ๋“œ๋œ ๋ชจ๋“  ๋ชจ๋ธ ๋ชฉ๋ก
ollama list

# ๋ชจ๋ธ ๊ฒ€์ƒ‰ ๋ฐ Pull
ollama pull qwen2.5-coder:32b

# ๋ชจ๋ธ์˜ ๋ชจ๋“  ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ํƒœ๊ทธ ํ™•์ธ
ollama show qwen2.5

# ๋””์Šคํฌ ๊ณต๊ฐ„ ํ™•๋ณด๋ฅผ ์œ„ํ•ด ๋ชจ๋ธ ์ œ๊ฑฐ
ollama rm llama3.2:3b

์˜คํ”ˆ์†Œ์Šค Ollama ๋ชจ๋ธ: ์ง€์—ญ๋ณ„ ๋งฅ๋ฝ

EU / GDPR + ๋ผ์ด์„ ์Šค ์ค€์ˆ˜. ํ”„๋กœ๋•์…˜์— Ollama ๋ชจ๋ธ์„ ๋ฐฐํฌํ•˜๋Š” EU ์กฐ์ง์˜ ๊ฒฝ์šฐ, ์„ฑ๋Šฅ๋งŒํผ์ด๋‚˜ ๋ผ์ด์„ ์Šค ์„ ํƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. Apache 2.0(์™„์ „ ๊ฐœ๋ฐฉ, ์ƒ์—…์  ์ด์šฉ ํ—ˆ์šฉ): Mistral Small, Mistral Small 3.1, Qwen3 7B, Qwen 3.6 27B, Devstral Small 24B, Gemma 2 2B. Meta Llama Community Licence(์›”๊ฐ„ ํ™œ์„ฑ ์‚ฌ์šฉ์ž 7์–ต ๋ช… ์ดˆ๊ณผ ์‹œ ์ƒ์—…์  ์ด์šฉ ์ œํ•œ): Llama 3.3 8B, Llama 3.2 3B, Llama 3.2 Vision 11B. MIT(์ƒ์—…์  ์ด์šฉ ํ—ˆ์šฉ): DeepSeek-R1 7B, DeepSeek-R1 14B. Modified MIT(๊ท€์† ์กฐํ•ญ์ด ์žˆ๋Š” ์ƒ์—…์  ์ด์šฉ ํ—ˆ์šฉ): Kimi K2.6. ๊ทœ์ œ ๋ถ„์•ผ์˜ EU ๊ธฐ์—…์—๋Š” Mistral ๋ชจ๋ธ(ํ”„๋ž‘์Šค, Apache 2.0) ๋˜๋Š” Devstral Small 24B(์ตœ๊ณ  ์—์ด์ „ํŠธ ์ฝ”๋”ฉ)๊ฐ€ ๊ธฐ๋ณธ ๊ถŒ์žฅ ์‚ฌํ•ญ์ž…๋‹ˆ๋‹ค -- EU ์ถœ์ฒ˜, ํด๋ฆฐ ๋ผ์ด์„ ์Šค, ์ƒ์—…์  ๋ฐฐํฌ ์ œํ•œ ์—†์Œ. GDPR ์ค€์ˆ˜: ๋ชจ๋“  ๋ชจ๋ธ์ด Ollama๋ฅผ ํ†ตํ•ด ์™„์ „ํžˆ ์˜จํ”„๋ ˆ๋ฏธ์Šค์—์„œ ์‹คํ–‰๋˜๋ฏ€๋กœ, ๋ชจ๋ธ ์„ ํƒ์— ๊ด€๊ณ„์—†์ด ์™ธ๋ถ€ ์„œ๋ฒ„๋กœ ๊ฐœ์ธ ๋ฐ์ดํ„ฐ๊ฐ€ ์ „์†ก๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

์ผ๋ณธ(METI). ์ผ๋ณธ ๊ธฐ์—…์˜ Ollama ๋ฐฐํฌ์—๋Š” Qwen3 / Qwen 3.6 ๋ชจ๋ธ ๊ณ„์—ด์ด ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค -- ๊ธฐ๋ณธ ์ผ๋ณธ์–ด ํ† ํฌ๋‚˜์ด์ œ์ด์…˜์ด Llama๋‚˜ Mistral๋ณด๋‹ค ์ผ๋ณธ์–ด ํ…์ŠคํŠธ๋ฅผ 30~40% ๋” ํ† ํฐ ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜์—ฌ ์ถ”๋ก  ์‹œ๊ฐ„๊ณผ KV ์บ์‹œ ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ง์ ‘์ ์œผ๋กœ ์ค„์ž…๋‹ˆ๋‹ค. ์ผ๋ณธ์–ด ์ฝ”๋”ฉ ์›Œํฌํ”Œ๋กœ: Qwen 3.6 27B(77.2% SWE-bench)๋Š” ์ผ๋ณธ์–ด ์ฝ”๋“œ ์ฃผ์„์„ ๊ธฐ๋ณธ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๋ฉฐ 2026๋…„ ์ตœ๊ณ  ๋ฐ€์ง‘ ์ฝ”๋”ฉ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. METI AI ๊ฑฐ๋ฒ„๋„Œ์Šค ๋ฌธ์„œํ™” ์‹œ ์ •ํ™•ํ•œ ๋ชจ๋ธ ๋ฒ„์ „์„ ๊ธฐ์žฌํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. `ollama show <model>`์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ทœ์ • ์ค€์ˆ˜ ๊ธฐ๋ก์„ ์œ„ํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜, ์–‘์žํ™” ๋ ˆ๋ฒจ, ์ปจํ…์ŠคํŠธ ๊ธธ์ด๋ฅผ ํฌํ•จํ•œ ์ „์ฒด ๋ชจ๋ธ ์‚ฌ์–‘์„ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

์ค‘๊ตญ. ์ค‘๊ตญ์˜ CAC ์ƒ์„ฑํ˜• AI ์กฐ์น˜(2023๋…„)์— ๋”ฐ๋ผ, ์ตœ์ข… ์‚ฌ์šฉ์ž์—๊ฒŒ AI ์„œ๋น„์Šค๋ฅผ ์ œ๊ณตํ•˜๋Š” ์กฐ์ง์€ ์‚ฌ์šฉํ•˜๋Š” ๋ชจ๋ธ์„ ๋“ฑ๋กํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. Qwen3 / Qwen 3.6(Alibaba, Apache 2.0)์€ ์ค‘๊ตญ ๊ธฐ์—…์˜ Ollama ๋ฐฐํฌ์— ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค -- ์ค‘๊ตญ ๋ชจ๋ธ ์ถœ์ฒ˜, Apache 2.0 ๋ผ์ด์„ ์Šค, ์ค‘๊ตญ์–ด ์ž‘์—… ์ตœ๊ณ  ์„ฑ๋Šฅ, ์ตœ์ƒ์œ„ ๋ฒค์น˜๋งˆํฌ. Kimi K2.6(Moonshot AI, Modified MIT ๋ผ์ด์„ ์Šค, 32B ํ™œ์„ฑ/1T ์ „์ฒด MoE)๋„ ์ค‘๊ตญ ์ถœ์ฒ˜์˜ ์ตœ์ƒ์œ„ ์ฝ”๋”ฉ ์˜ต์…˜์œผ๋กœ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. Pull ๋ช…๋ น: ์ตœ๊ณ  ํ’ˆ์งˆ์—๋Š” `ollama run qwen3.6:27b`, ๋น ๋ฅธ ์†๋„์—๋Š” `ollama run qwen3:7b`. ์ถ”๋ก  ์ž‘์—…์—๋Š” DeepSeek-R1(DeepSeek, MIT ๋ผ์ด์„ ์Šค)์ด ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. Ollama๋ฅผ ํ†ตํ•ด ๋กœ์ปฌ๋กœ ์ฒ˜๋ฆฌ๋˜๋Š” ๋ฐ์ดํ„ฐ์˜ ๊ฒฝ์šฐ, ์ค‘๊ตญ์˜ PIPL ๊ตญ๊ฒฝ ๊ฐ„ ๋ฐ์ดํ„ฐ ์ด์ „ ์š”๊ตฌ ์‚ฌํ•ญ์ด ์ ์šฉ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค -- ์ถ”๋ก ์ด ์˜จํ”„๋ ˆ๋ฏธ์Šค์—์„œ ์œ ์ง€๋ฉ๋‹ˆ๋‹ค.

Ollama ๋ชจ๋ธ ์„ ํƒ ์‹œ ํ”ํ•œ ์‹ค์ˆ˜๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

RAM ํ™•์ธ ์—†์ด ๊ธฐ๋ณธ์ ์œผ๋กœ ๊ฐ€์žฅ ํฐ ๋ชจ๋ธ ํƒœ๊ทธ๋ฅผ Pullํ•˜๋Š” ๊ฒฝ์šฐ

ํƒœ๊ทธ ์—†์ด `ollama pull llama3.3`์„ ์‹คํ–‰ํ•˜๋ฉด ์ผ๋ฐ˜์ ์œผ๋กœ ๊ฐ€์žฅ ํฐ ํ‘œ์ค€ ์–‘์žํ™” ๋ณ€ํ˜•์ด ๋‹ค์šด๋กœ๋“œ๋ฉ๋‹ˆ๋‹ค. 8GB RAM ๊ธฐ๊ธฐ์—์„œ llama3.3(70B, ~40GB)์„ Pullํ•˜๋ฉด ์‹คํŒจํ•˜๊ฑฐ๋‚˜ ์‹ฌ๊ฐํ•œ ์Šค์™‘ ์‚ฌ์šฉ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ํ•ญ์ƒ ๋ณ€ํ˜•์„ ์ง€์ •ํ•˜์‹ญ์‹œ์˜ค: 8GB ๊ธฐ๊ธฐ์—๋Š” `ollama pull llama3.2:3b`.

์ž‘์—…๋ณ„ ํŠนํ™” ๋ชจ๋ธ์ด ์žˆ์„ ๋•Œ ๋ฒ”์šฉ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒฝ์šฐ

์ฝ”๋”ฉ ์ž‘์—…์˜ ๊ฒฝ์šฐ, `qwen2.5-coder:7b`๋Š” 72% HumanEval์„ ๊ธฐ๋กํ•˜๊ณ  ๋ฒ”์šฉ `qwen2.5:7b`๋„ 72%๋ฅผ ๊ธฐ๋กํ•˜์ง€๋งŒ -- `qwen2.5-coder`๋Š” ์ฝ”๋“œ ์™„์„ฑ์„ ์œ„ํ•œ FIM ์ง€์›์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ์ถ”๋ก /์ˆ˜ํ•™์—์„œ๋Š” `deepseek-r1:7b`๊ฐ€ MATH์—์„œ 52%, `mistral:7b`๋Š” 28%๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค. Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์— ์ž‘์—…๋ณ„ ํŠนํ™” ๋ชจ๋ธ์ด ์กด์žฌํ•˜๋Š” ์ด์œ ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

์›Œํฌํ”Œ๋กœ ๊ตฌ์ถ• ์ „์— ๋ชจ๋ธ ๊ฐ€์šฉ์„ฑ์„ ํ™•์ธํ•˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ

Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ๋ณ€๊ฒฝ๋ฉ๋‹ˆ๋‹ค -- ๋ชจ๋ธ์ด ์ถ”๊ฐ€๋˜๊ณ  ๊ฐ„ํ˜น ์ œ๊ฑฐ๋ฉ๋‹ˆ๋‹ค. ํŠน์ • ๋ชจ๋ธ ๊ธฐ๋ฐ˜์˜ ํ”„๋กœ๋•์…˜ ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ตฌ์ถ•ํ•˜๊ธฐ ์ „์—, ํ•ด๋‹น ๋ชจ๋ธ์ด ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์— ์žˆ๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค(๋กœ์ปฌ์—์„œ `ollama list`, ๋˜๋Š” ollama.com/library ํ™•์ธ). ํ”„๋กœ๋•์…˜ ์›Œํฌํ”Œ๋กœ์—์„œ๋Š” ํŠน์ • ๋ชจ๋ธ ๋ฒ„์ „์„ ๊ณ ์ •ํ•˜์‹ญ์‹œ์˜ค: `ollama pull llama3.1:8b-instruct-q4_K_M`.

๋Œ€ํ˜• ๋ชจ๋ธ์— ์–‘์žํ™” ํƒœ๊ทธ๋ฅผ ์ง€์ •ํ•˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ

์–‘์žํ™” ์ ‘๋ฏธ์‚ฌ ์—†์ด `ollama pull qwen2.5-coder:32b`๋ฅผ ์‹คํ–‰ํ•˜๋ฉด VRAM์ด ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์—†๋Š” ํฌ๊ธฐ์˜ ๊ธฐ๋ณธ ๋ณ€ํ˜•์ด ๋‹ค์šด๋กœ๋“œ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 16GB VRAM์—์„œ๋Š” ๋ช…์‹œ์  Q4_K_M ๋ณ€ํ˜•์„ Pullํ•˜์‹ญ์‹œ์˜ค: `ollama pull qwen2.5-coder:32b-instruct-q4_K_M`. Pull ํ›„ `ollama show <model>`์„ ์‹คํ–‰ํ•˜์—ฌ VRAM ์š”๊ตฌ ์‚ฌํ•ญ์ด ํ•˜๋“œ์›จ์–ด์™€ ์ผ์น˜ํ•˜๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

DeepSeek-R1์ด ํ‘œ์ค€ ์ฑ„ํŒ… ๋ชจ๋ธ๋งŒํผ ๋น ๋ฅผ ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€ํ•˜๋Š” ๊ฒฝ์šฐ

DeepSeek-R1์€ ์ตœ์ข… ๋‹ต๋ณ€ ์ „์— ๋ช…์‹œ์ ์ธ ์—ฐ์‡„ ์‚ฌ๊ณ  ์ถ”๋ก  ํ† ํฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค -- ์ด๊ฒƒ์ด ์ˆ˜ํ•™๊ณผ ๋…ผ๋ฆฌ์—์„œ ํ‘œ์ค€ ๋ชจ๋ธ๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์ด์œ ์ด์ง€๋งŒ, ์‘๋‹ต๋‹น 3~5๋ฐฐ ๋” ๋งŽ์€ ํ† ํฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๋น ๋ฅธ ์ฑ„ํŒ…์ด๋‚˜ ํ•œ ์ค„ ๋‹ต๋ณ€์—๋Š” `llama3.1:8b`๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ์ถ”๋ก  ์ •ํ™•๋„๊ฐ€ ์†๋„๋ณด๋‹ค ์ค‘์š”ํ•œ ์ž‘์—…์—๋Š” DeepSeek-R1์„ ํ™œ์šฉํ•˜์‹ญ์‹œ์˜ค.

Ollama ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์— ๊ด€ํ•œ ์ž์ฃผ ๋ฌป๋Š” ์งˆ๋ฌธ

Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์—๋Š” ๋ช‡ ๊ฐœ์˜ ๋ชจ๋ธ์ด ์žˆ์Šต๋‹ˆ๊นŒ?

2026๋…„ 6์›” ๊ธฐ์ค€, Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์—๋Š” ๊ณต์‹ ์ง€์›์„ ๋ฐ›๋Š” ์•ฝ 4,500๊ฐœ ์ด์ƒ์˜ ๋ชจ๋ธ(ํ๋ ˆ์ดํŒ…๋œ ๋ชจ๋ธ + ์ปค๋ฎค๋‹ˆํ‹ฐ ๊ธฐ์—ฌ)์ด ์žˆ์Šต๋‹ˆ๋‹ค. Hugging Face์—๋Š” ์ปค์Šคํ…€ Modelfile์„ ํ†ตํ•ด Ollama๋กœ ๋กœ๋“œํ•  ์ˆ˜ ์žˆ๋Š” ์ˆ˜์ฒœ ๊ฐœ์˜ ์ถ”๊ฐ€ GGUF ๋ชจ๋ธ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

Hugging Face ๋ชจ๋ธ์„ Ollama์—์„œ ์ง์ ‘ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์˜ˆ. Hugging Face์—์„œ GGUF ํŒŒ์ผ์„ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  Modelfile์„ ์ƒ์„ฑํ•˜์‹ญ์‹œ์˜ค: `FROM ./model.gguf`. ๊ทธ๋Ÿฐ ๋‹ค์Œ `ollama create mymodel -f Modelfile`์„ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ณต์‹ Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์— ์—†๋Š” ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ ๋ฐ ๋ชจ๋ธ์„ ํฌํ•จํ•˜์—ฌ ๋ชจ๋“  GGUF ํŒŒ์ผ์—์„œ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ ์ฑ—๋ด‡ ๊ตฌ์ถ•์— ๊ฐ€์žฅ ์ ํ•ฉํ•œ Ollama ๋ชจ๋ธ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

๋ฒ”์šฉ ๋กœ์ปฌ ์ฑ—๋ด‡: `qwen3.6:27b`(์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด ์ „๋ฐ˜ ์ตœ๊ณ , Q4์—์„œ 24GB์— ์ ํ•ฉ), ๋˜๋Š” 8GB RAM์—์„œ๋Š” `llama3.2:3b`(๊ฐ€์žฅ ์‰ฌ์šด ์‹œ์ž‘์ ). 16GB ๊ธฐ๊ธฐ: `gpt-oss:20b`(~o3-mini ์ˆ˜์ค€) ๋˜๋Š” `mistral-small3.1`. ์ฝ”๋”ฉ ์–ด์‹œ์Šคํ„ดํŠธ ์ฑ—๋ด‡: `qwen3.6:27b`(77.2% SWE-bench), `kimi-k2.6`(์ตœ์ „์„  MoE), ๋˜๋Š” `devstral-small:24b`(์—์ด์ „ํŠธ ์ฝ”๋”ฉ). localhost:11434์˜ Ollama API์— ์—ฐ๊ฒฐ๋˜๋Š” ์›น ๊ธฐ๋ฐ˜ ์ธํ„ฐํŽ˜์ด์Šค์ธ Open WebUI์™€ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๋ชจ๋“  Ollama ๋ชจ๋ธ์ด ์ง„์ •ํ•œ ์˜คํ”ˆ์†Œ์Šค์ž…๋‹ˆ๊นŒ?

๊ทธ๋ ‡์ง€ ์•Š์Šต๋‹ˆ๋‹ค. Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์—๋Š” ๋‹ค์–‘ํ•œ ๋ผ์ด์„ ์Šค์˜ ๋ชจ๋ธ์ด ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. Llama 3.x/4.x๋Š” Meta Llama Community Licence๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค(OSI ์Šน์ธ ์˜คํ”ˆ์†Œ์Šค ์•„๋‹˜ -- ์›”๊ฐ„ ํ™œ์„ฑ ์‚ฌ์šฉ์ž 7์–ต ๋ช… ์ดˆ๊ณผ ์‹œ ์ƒ์—…์  ์ด์šฉ ์ œํ•œ). Mistral Small, Qwen3, Qwen 3.6, Devstral, Gemma ๋ชจ๋ธ์€ Apache 2.0(์™„์ „ ์˜คํ”ˆ์†Œ์Šค)์ž…๋‹ˆ๋‹ค. Kimi K2.6์€ Modified MIT ๋ผ์ด์„ ์Šค(๊ท€์† ์กฐํ•ญ์ด ์žˆ๋Š” ์ƒ์—…์  ์ด์šฉ ํ—ˆ์šฉ)์ž…๋‹ˆ๋‹ค. ์ƒ์—…์  ๋ฐฐํฌ ์ „์— ํ•ญ์ƒ ๋ผ์ด์„ ์Šค๋ฅผ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

RAG๋ฅผ ์œ„ํ•ด Ollama์—์„œ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋Š” ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

`nomic-embed-text`๊ฐ€ ํ‘œ์ค€ ์„ ํƒ์ž…๋‹ˆ๋‹ค -- 768์ฐจ์› ์ž„๋ฒ ๋”ฉ์„ ์ƒ์„ฑํ•˜๊ณ , ๋ฌธ์„œ๋‹น ๋ฐ€๋ฆฌ์ดˆ ๋‹จ์œ„๋กœ ์‹คํ–‰๋˜๋ฉฐ, ๊ฒ€์ƒ‰ ์ž‘์—…์— ํŠนํ™”๋œ 1์–ต 3,700๋งŒ ํŒŒ๋ผ๋ฏธํ„ฐ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. `ollama pull nomic-embed-text`๋กœ Pullํ•˜์‹ญ์‹œ์˜ค. Open WebUI์˜ ๋‚ด์žฅ RAG, LangChain์˜ OllamaEmbeddings, ๋˜๋Š” LlamaIndex์™€ ํ•จ๊ป˜ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ์–ผ๋งˆ๋‚˜ ์ž์ฃผ ์ƒˆ ๋ชจ๋ธ๋กœ ์—…๋ฐ์ดํŠธ๋ฉ๋‹ˆ๊นŒ?

Ollama ํŒ€์€ ์ฃผ์š” ๋ฆด๋ฆฌ์Šค ํ›„ ๋ฉฐ์น ์—์„œ ๋ช‡ ์ฃผ ๋‚ด์— ์ƒˆ ๋ชจ๋ธ์„ ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. Kimi K2.6๊ณผ Qwen 3.6์€ 2026๋…„ 4์›” ๋ฆด๋ฆฌ์Šค ํ›„ ๋ฉฐ์น  ๋‚ด์— ๋“ฑ์žฅํ–ˆ์Šต๋‹ˆ๋‹ค. Ollama v0.24.0(2026๋…„ 5์›” 14์ผ)์€ Gemma 4 ๋ Œ๋”๋ง ๊ฐœ์„ ์„ ์ถ”๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ƒˆ ๋ชจ๋ธ ๋ฐœํ‘œ๋ฅผ ์œ„ํ•ด Ollama GitHub ์ €์žฅ์†Œ(github.com/ollama/ollama) ๋˜๋Š” Ollama Twitter/X ๊ณ„์ •์„ ํŒ”๋กœ์šฐํ•˜์‹ญ์‹œ์˜ค.

`ollama pull`๊ณผ `ollama run`์˜ ์ฐจ์ด๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

`ollama pull`์€ ๋ชจ๋ธ ํŒŒ์ผ์„ ๋กœ์ปฌ ์Šคํ† ๋ฆฌ์ง€์— ๋‹ค์šด๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค(1ํšŒ ์ž‘์—…). `ollama run`์€ Pull ํ›„ ์ฆ‰์‹œ ๋Œ€ํ™”ํ˜• ์„ธ์…˜์„ ์‹œ์ž‘ํ•˜๊ฑฐ๋‚˜, ์ด๋ฏธ Pull๋œ ๋ชจ๋ธ์ด ์žˆ์œผ๋ฉด ์žฌ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ํ•œ ๋ฒˆ Pullํ•˜๊ณ  ์—ฌ๋Ÿฌ ๋ฒˆ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ ์žฌ๋‹ค์šด๋กœ๋“œ๊ฐ€ ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

๊ฐ™์€ ๊ธฐ๊ธฐ์—์„œ ์—ฌ๋Ÿฌ ๋ชจ๋ธ์„ ๋™์‹œ์— ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์˜ˆ, ํ•˜๋“œ์›จ์–ด์— ์ถฉ๋ถ„ํ•œ VRAM์ด ์žˆ๋Š” ๊ฒฝ์šฐ. ๋ณ„๋„์˜ ํ„ฐ๋ฏธ๋„ ์ฐฝ์ด๋‚˜ ์‰˜ ์„ธ์…˜์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค -- ํ•œ ์ฐฝ์—์„œ `ollama run llama3.2`๋ฅผ ์‹คํ–‰ํ•˜๊ณ  ๋‹ค๋ฅธ ์ฐฝ์—์„œ `ollama run qwen2.5:7b`๋ฅผ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. Ollama๋Š” VRAM ๊ณต์œ ๋ฅผ ์ž๋™์œผ๋กœ ๊ด€๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ๊ณผ๋ถ€ํ•˜๋ฅผ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด `nvidia-smi`๋‚˜ ์‹œ์Šคํ…œ ํ™œ๋™์„ ๋ชจ๋‹ˆํ„ฐ๋งํ•˜์‹ญ์‹œ์˜ค.

๋ชจ๋ธ์„ ์ตœ์‹  ๋ฒ„์ „์œผ๋กœ ์—…๋ฐ์ดํŠธํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

`ollama pull [model-name]`์€ ์—…๋ฐ์ดํŠธ๋ฅผ ํ™•์ธํ•˜๊ณ  ๊ฐ€์šฉํ•œ ๊ฒฝ์šฐ ์ตœ์‹  ๋ฒ„์ „์„ ๋‹ค์šด๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค. ์ด์ „ ๋ฒ„์ „์œผ๋กœ ๋˜๋Œ๋ฆฌ๊ฑฐ๋‚˜ ํŠน์ • ๋ฒ„์ „์„ ์‚ฌ์šฉํ•˜๋ ค๋ฉด ๋ฒ„์ „ ํƒœ๊ทธ๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค: `ollama pull llama3.1:8b` ๋˜๋Š” `ollama pull llama3.1:8b-instruct-q4_K_M`. `ollama show [model-name]`์œผ๋กœ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ ๋ฒ„์ „์„ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

Ollama์˜ ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ์€ ์ƒ์—…์ ์œผ๋กœ ๋ฌด๋ฃŒ๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

๋Œ€๋ถ€๋ถ„์€ ๊ทธ๋ ‡์ง€๋งŒ ์ „๋ถ€๋Š” ์•„๋‹™๋‹ˆ๋‹ค. Llama 3.x(Meta Llama Community Licence)๋Š” ์›”๊ฐ„ ํ™œ์„ฑ ์‚ฌ์šฉ์ž 7์–ต ๋ช… ์ดˆ๊ณผ ์‹œ ์ƒ์—…์  ์ด์šฉ์„ ์ œํ•œํ•ฉ๋‹ˆ๋‹ค. Mistral Small, Qwen3, Gemma ๋ชจ๋ธ์€ Apache 2.0(์™„์ „ ์ƒ์—…์  ์ด์šฉ ํ—ˆ์šฉ)์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์—… ๋ฐฐํฌ ์ „์— ํ•ญ์ƒ ๋ผ์ด์„ ์Šค๋ฅผ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค -- ๋ชจ๋ธ์˜ Hugging Face ํŽ˜์ด์ง€๋‚˜ Ollama ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ํ•ญ๋ชฉ์„ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

์ถœ์ฒ˜

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Run PromptQuorum with a local LLM, your own API keys, or both โ€” you pick the backend.

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

2026๋…„ ์ตœ๊ณ  Ollama ๋ชจ๋ธ: ์˜คํ”ˆ์†Œ์Šค LLM ์ƒ์œ„ 10๊ฐœ | PromptQuorum