Key Takeaways
- ์๋น์ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ : Qwen 3.6 27B(77.2% SWE-bench, Q4์์ 24GB์ ์ ํฉ). ๊ท ํ์กํ ๋ฒ์ฉ: qwen3:30b.
- ๋ค์ด๋ก๋ ์ต๋ค: Llama 3.2 3B(ํํ ๋ฆฌ์ผ์ฉ)์ Llama ๊ณ์ด -- ๊ฐ์ฅ ๋์ ๋๊ตฌ ์ง์.
- ์ถ๋ก ์ต๊ณ : DeepSeek-R1(์ฐ์ ์ฌ๊ณ )๊ณผ gpt-oss:20b(์กฐ์ ๊ฐ๋ฅํ ์ถ๋ก , ~o3-mini ์์ค).
- ์ฝ๋ฉ ์ต๊ณ : Kimi K2.6(์ต์ ์ MoE), Qwen 3.6 27B(์ต๊ณ ๋ฐ์ง ๋ชจ๋ธ), Devstral Small 24B(์ต๊ณ ์์ด์ ํธ ์ฝ๋ฉ), qwen3-coder:30b(์ฝ๋ ์์ฑ) -- ํด๋น ํฌ๊ธฐ์์ ๊ฐ์ฅ ๋์ ๋ฒค์น๋งํฌ.
- ์ํ ์ต๊ฐ / 16GB: gpt-oss:20b. ๋น์ /๋ฉํฐ๋ชจ๋ฌ ์ต๊ณ : Gemma 4(E4B+). ๊ธด ์ปจํ ์คํธ(10M) / ๋ํ ๋ฉํฐ๋ชจ๋ฌ ์ต๊ณ : Llama 4 Scout(~55GB).
- 2026๋ 6์ ๊ธฐ์ค, Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ์๋ 4,500๊ฐ ์ด์์ ๋ชจ๋ธ์ด ์์ต๋๋ค. ๋ชจ๋ ๋ชจ๋ธ์ `ollama pull <name>`์ผ๋ก ์ด์ฉ ๊ฐ๋ฅํฉ๋๋ค.
Ollama ์ ๊ท ์์ โ 2026๋ 6์ ์ ๋ฐ์ดํธ
ํ์ฌ Ollama ๋ฒ์ : v0.24.0(2026๋ 5์ 14์ผ ์ถ์). ollama.com/download์์ ์ฌ์ฉ ๊ฐ๋ฅํ ์ต์ ์์ ๋ฆด๋ฆฌ์ค์ ๋๋ค.
์ต์ ๋ฆด๋ฆฌ์ค(2026๋ 5์ 14์ผ): Ollama v0.24.0์ ์ฌ๊ณ ๊ธฐ๋ฅ๊ณผ ๋๊ตฌ ํธ์ถ ๊ธฐ๋ฅ์ ๊ฐ์ถ Gemma 4 ์ ์ฒด ์ง์์ ์ถ๊ฐํ์ต๋๋ค. ์ด๋ฒ ๋ฆด๋ฆฌ์ค์๋ ๊ฐ์ ๋ ์์ํ ์ฒ๋ฆฌ์ ๋ชจ๋ธ ์ถ๋ก ์ต์ ํ๊ฐ ํฌํจ๋์์ต๋๋ค. ์์ธํ ๋ฆด๋ฆฌ์ค ๋ ธํธ๋ github.com/ollama/ollama/releases์์ ํ์ธํ์ญ์์ค.
์ ๊ท ์ถ๊ฐ ๋ชจ๋ธ(2026๋ 5~6์):
- Kimi K2.6(Moonshot AI, 2026๋ 4์ 20์ผ) โ ์ต์ ์ ์ฝ๋ฉ ๋ชจ๋ธ, SWE-Bench Pro 58.6(GPT-5.5์ ๋์ ). MoE ์ํคํ ์ฒ(32B ํ์ฑ / 1T ์ ์ฒด). Modified MIT ๋ผ์ด์ ์ค. Pull: `ollama pull kimi-k2.6`
- Qwen 3.6 27B(Alibaba, 2026๋ 4์ 16์ผ) โ ์๋น์ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ , 77.2% SWE-bench, Apache 2.0, Q4์์ 24GB์ ์ ํฉ. ๋ํ Qwen3.6-35B-A3B(MoE, 73.4 SWE-bench)๋ ์์ต๋๋ค. Pull: `ollama pull qwen3.6:27b`
- GLM-5.1(Z.ai, 2026๋ 4์ 7์ผ) โ 744B / 40B ํ์ฑ MoE, MIT ๋ผ์ด์ ์ค, SWE-Bench Pro 58.4. ๊ตฌ์กฐํ๋ ์ฝ๋ ์์ฑ ๋ถ์ผ ์ ๋. Pull: `ollama pull glm-5.1`
- gpt-oss(OpenAI, 2026๋ ) โ ์คํ ์จ์ดํธ MoE: gpt-oss:20b(21B ์ ์ฒด / 3.6B ํ์ฑ, 16GB์์ ์คํ, ~o3-mini ์์ค, ์กฐ์ ๊ฐ๋ฅํ ์ถ๋ก )์ gpt-oss:120b(80GB). Pull: `ollama pull gpt-oss:20b`
- Gemma 4(Google, 2026๋ 4์ 2์ผ) โ ๋ฉํฐ๋ชจ๋ฌ ํฌ๊ธฐ E2B / E4B / E12B(26B MoE) / E27B(31B ๋ฐ์ง), ๋ชจ๋ ๋น์ ๊ณผ ๋๊ตฌ ํธ์ถ ์ง์. E4B๋ ~6GB VRAM์์ ์คํ๋ฉ๋๋ค. Pull: `ollama pull gemma4:e4b`
# Ollama๋ฅผ ์ต์ ๋ฒ์ ์ผ๋ก ์
๋ฐ์ดํธ
curl https://ollama.ai/install.sh | sh
# ๋๋ Mac์์: brew upgrade ollama
# ํ์ฌ ๋ฒ์ ํ์ธ
ollama --version # ์ถ๋ ฅ: ollama version 0.24.0
# ์ต์ ์ ๊ท ๋ชจ๋ธ Pull
ollama pull kimi-k2.6
ollama pull qwen3.6:27b
ollama pull glm-5.12026๋ Ollama์์ ๊ฐ์ฅ ์ธ๊ธฐ ์๋ ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น?
Ollama์์์ ์ธ๊ธฐ๋ ๊ฐ ๋ชจ๋ธ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํ์ด์ง์ ํ์๋๋ ๋ค์ด๋ก๋ ์๋ก ์ธก์ ๋ฉ๋๋ค. 2026๋ 6์ ๊ธฐ์ค, ๋ค์ด๋ก๋ ์์ ๋ชจ๋ธ์ ์ฌ์ ํ Meta์ Llama ๊ณ์ด์ด ์ฃผ๋ํ๊ณ ์์ต๋๋ค -- Llama 3.2 3B๊ฐ ์ฒซ ์ค์น ํ ์คํธ ๋ชจ๋ธ๋ก ๋ง์ด ์ฌ์ฉ๋์ด ์ ์ฒด ๋ค์ด๋ก๋ 1์์ ๋๋ค. ๊ทธ๋ฌ๋ Llama 4 Scout๋ 2026๋ 4์ ์ถ์ ์ดํ ๋น ๋ฅด๊ฒ ์์๋ฅผ ์ฌ๋ฆฌ๊ณ ์์ต๋๋ค.
Qwen3๋ Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ๊ฐ์ฅ ๋น ๋ฅด๊ฒ ์ฑ์ฅํ๋ ๋ชจ๋ธ ๊ณ์ด๋ก, Qwen3์ ์๋ก์ด Qwen 3.6 ๋ฐ์ง ๋ณํ์ด ๊ธฐ์กด Qwen3๋ฅผ ๋น ๋ฅด๊ฒ ๋์ฒดํ๊ณ ์์ต๋๋ค. DeepSeek-R1์ ์ถ์ ์ดํ ๋๊ท๋ชจ ๋ค์ด๋ก๋ ๊ธ์ฆ์ ๊ธฐ๋กํ์ผ๋ฉฐ ์ถ๋ก ์์ ์์ ๋์ ๋ค์ด๋ก๋ ์๋ฅผ ์ ์งํ๊ณ ์์ต๋๋ค.
Meta๋ 2026๋ 4์์ Scout(17B ํ์ฑ, 109B ์ ์ฒด, MoE)์ Maverick(17B ํ์ฑ, 400B ์ ์ฒด) ๋ณํ์ ํฌํจํ Llama 4๋ฅผ ์ถ์ํ์ต๋๋ค. Llama 4 Scout๋ ์ด์ Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ์์ ์์ ์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํฉ๋๋ค(`ollama pull llama4:scout`). Llama 4 ๊ณ์ด์ ํผํฉ ์ ๋ฌธ๊ฐ(MoE) ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํฉ๋๋ค โ ํ ํฐ๋น 17B ํ๋ผ๋ฏธํฐ๋ง ํ์ฑํ๋์ง๋ง, 109B ์ ์ฒด ํ๋ผ๋ฏธํฐ๋ก Scout๋ Q4์์ ~55GB VRAM์ด ํ์ํฉ๋๋ค(1.78๋นํธ์์๋ง 24GB์ ์ ํฉ, ~20 tok/s). Scout์ ํต์ฌ ํน์ง์ ์๋น์ ํ๋์จ์ด ์ ํฉ์ฑ์ด ์๋๋ผ 1,000๋ง ํ ํฐ ์ปจํ ์คํธ ์ฐฝ๊ณผ ๋ฉํฐ๋ชจ๋ฌ ์ ๋ ฅ์ ๋๋ค. ๊ฒฝ๋ ์ค์ (8GB RAM)์์๋ Llama 3.2 3B๊ฐ ์ฌ์ ํ ๊ฐ์ฅ ์ฌ์ด ์ฒซ ๋ฒ์งธ ๋ชจ๋ธ์ ๋๋ค. Ollama ์ํ๊ณ๋ 2026๋ 4์์ ํฌ๊ฒ ํ์ฅ๋์์ต๋๋ค. Kimi K2.6(Moonshot AI, Modified MIT ๋ผ์ด์ ์ค, 32B ํ์ฑ / 1T ์ ์ฒด MoE)์ SWE-Bench Pro 58.6์ ๋ฌ์ฑํ์ฌ GPT-5.5์ ๋์ ์ ๊ธฐ๋กํ์ต๋๋ค. Qwen 3.6 27B๋ ์๋น์ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ ๋ชจ๋ธ๋ก์ 77.2% SWE-bench๋ฅผ ๋ฌ์ฑํ์ต๋๋ค(Q4์์ 24GB์ ์ ํฉ). OpenAI์ ์คํ ์จ์ดํธ gpt-oss:20b(21B ์ ์ฒด / 3.6B ํ์ฑ MoE)๋ 16GB์์ ~o3-mini ์์ค์ ์กฐ์ ๊ฐ๋ฅํ ์ถ๋ก ์ผ๋ก ์คํ๋ฉ๋๋ค. Ollama v0.24.0์ ๋๊ตฌ ํธ์ถ ๊ฐ์ ๊ณผ ํจ๊ป Gemma 4 ์ง์์ ์ถ๊ฐํ์ต๋๋ค. Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ์ด์ 4,500๊ฐ ์ด์์ ๋ชจ๋ธ์ ๋ณด์ ํ๊ณ ์์ต๋๋ค.
์ฌ์ฉ ์ฌ๋ก๋ณ๋ก ๊ฐ์ฅ ์ ํฉํ Ollama ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น?
๋ชจ๋ธ ์ถ๋ ฅ ํ์ง์ ํ๋กฌํํธ ๋ฐฉ์์ ํฌ๊ฒ ์์กดํฉ๋๋ค. ์ฐ์ ์ฌ๊ณ , ํจ์ท ์์, ์ถ๋ ฅ ํ์ ์ง์ ๋ฑ ๋ชจ๋ ๋ก์ปฌ ๋ชจ๋ธ์์ ์๋ํ๋ ๊ตฌ์กฐํ๋ ๊ธฐ๋ฒ์ ํ๋กฌํํธ ์์ง๋์ด๋ง ๊ฐ์ด๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค. ์ถ๋ก ์์ ์์๋ ์ฐ์ ์ฌ๊ณ ํ๋กฌํํ ์ด DeepSeek-R1 ๋ฐ Qwen3 ์ถ๋ ฅ ํ์ง์ ํฌ๊ฒ ํฅ์์ํต๋๋ค. ์ด๋ฌํ ๋ชจ๋ธ์ ์์ํ ํธ๋ ์ด๋์คํ๋ฅผ ์ดํดํ๋ ค๋ฉด ์์ํ ๊ฐ์ด๋ โ๋ฅผ ์ฐธ์กฐํ์ญ์์ค. ๊ฐ ๋ชจ๋ธ์ ํ์ํ VRAM ์์ ํ์ธํ๋ ค๋ฉด VRAM ์๊ตฌ ์ฌํญ ๊ฐ์ด๋ โ๋ฅผ ์ฐธ์กฐํ์ญ์์ค. Gemma 4๋ฅผ ์ฌ์ฉํ ์์ด์ ํธ ์ํฌํ๋ก์ ๋ํด์๋ ํธ๋ฆฌ ์ค๋ธ ์ํธ ๋ฐ ReAct๋ฅผ ์ฐธ์กฐํ์ญ์์ค. ์ด๋ฌํ ๋ชจ๋ธ์ ์คํํ๊ธฐ ์ํ ํ๋์จ์ด ์๊ตฌ ์ฌํญ์ ํ๋์จ์ด ๊ฐ์ด๋ โ๋ฅผ ์ฐธ์กฐํ์ญ์์ค. ์ด ๋ชฉ๋ก์ ๋๊ตฌ ํธ์ถ ๋ชจ๋ธ์ด ํ์ผ ๋ฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ก์ธ์ค์ ํจ๊ป ๋ค๋จ๊ณ ๋ฃจํ์ ์ฐ๊ฒฐ๋๋ฉด ์คํ์์ค ์ค์ผ์คํธ๋ ์ด์ ํจํด์ ๋ํด MCP๋ฅผ ํ์ฉํ ๋ก์ปฌ AI ์์ด์ ํธ๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
- ์ผ๋ฐ ์ฑํ (์ ๋ฌธ): `ollama run llama3.2:3b` -- ๋ฌธ์๊ฐ ๊ฐ์ฅ ๋ง๊ณ ์ฒซ ๋ฒ์งธ ๋ชจ๋ธ๋ก ์ต์ ์ง์.
- ์ผ๋ฐ ์ฑํ (์ ๋ฐ ์ต๊ณ ): `ollama run qwen3.6:27b` -- 77.2% SWE-bench, ์๋น์ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ , Q4์์ 24GB์ ์ ํฉ. ๊ท ํ์กํ ๋ฒ์ฉ: `ollama run qwen3:30b`. 8GB ๊ธฐ๊ธฐ์์๋ `ollama run llama3.2:3b`๋ฅผ ์ ์งํ์ญ์์ค.
- ๊ธด ์ปจํ ์คํธ / ๋ฉํฐ๋ชจ๋ฌ: `ollama run llama4:scout` -- 1,000๋ง ํ ํฐ ์ปจํ ์คํธ + ๋ฉํฐ๋ชจ๋ฌ, MoE(17B ํ์ฑ/109B ์ ์ฒด). Q4์์ ~55GB VRAM ํ์(1.78๋นํธ์์๋ง 24GB์ ์ ํฉ, ~20 tok/s).
- ์ํ ์ต๊ฐ / 16GB: `ollama run gpt-oss:20b` -- 21B ์ ์ฒด / 3.6B ํ์ฑ MoE, ~o3-mini ์์ค, ์กฐ์ ๊ฐ๋ฅํ ์ถ๋ก . ๋ ํฐ ๋ชจ๋ธ: `ollama run gpt-oss:120b`(80GB).
- 8GB์์ ์ฝ๋ฉ: `ollama run qwen3:8b` -- 8GB VRAM ๊ธฐ๊ธฐ ์ต๊ณ ๋ก์ปฌ ์ฝ๋ฉ ๋ชจ๋ธ. 76% HumanEval, 5GB ์ฌ์ฉ, ๋ค๊ตญ์ด ์ง์.
- 8GB์์ ์ผ๋ฐ ์ถ๋ก (์ฝ๋ฉ ์ธ): `ollama run mistral:7b` -- 8GB์์ ๊ฐ์ฅ ๋น ๋ฅธ ๋ฒ์ฉ ๋ชจ๋ธ, 40~60 tok/sec.
- ์ฝ๋ฉ(์ต๊ณ ์์ด์ ํธ, 24B): `ollama run devstral-small:24b` -- ์ต๊ณ ์์ด์ ํธ ์ฝ๋ฉ ๋ชจ๋ธ(๋ค์ค ํ์ผ ํธ์ง, ๋๋ฒ๊น ). 16GB RAM. Mistral AI ์ ๊ณต.
- ์ฝ๋ฉ(์ต๊ณ ๋ฐ์ง, 27B): `ollama run qwen3.6:27b` -- 77.2% SWE-bench. ์ต๊ณ ๋ฐ์ง ์ฝ๋ฉ ๋ชจ๋ธ. 22GB VRAM.
- ์ฝ๋ฉ(์ต์ ์ MoE): `ollama run kimi-k2.6` -- SWE-Bench Pro 58.6(GPT-5.5 ๋์ ), ์ต์์. MoE(32B ํ์ฑ/1T ์ ์ฒด). Modified MIT ๋ผ์ด์ ์ค. ์๋น์ ํ๋์จ์ด์๋ ์์ํ ํ์.
- ์์ด์ ํธ ์์ ๋ฐ ๋๊ตฌ ํธ์ถ: `ollama run gemma4:e4b` -- 2026๋ 4์ 2์ผ ์ถ์. ๋ด์ฅ ๋๊ตฌ ํธ์ถ + ๋น์ ์ง์. ๋ก์ปฌ ์์ด์ ํธ, ํจ์ ํธ์ถ, ๊ตฌ์กฐํ๋ ์ถ๋ ฅ์ ๊ถ์ฅ. 6GB RAM.
- ์ถ๋ก ๋ฐ ์ํ: `ollama run deepseek-r1:7b` -- ์ฐ์ ์ฌ๊ณ ๋ชจ๋ธ, 7B์์ ์ต๊ณ ๋ก์ปฌ ์ํ ์ฑ๋ฅ.
- ๋ค๊ตญ์ด: `ollama run qwen3:7b` -- 29๊ฐ ์ด์ ์ธ์ด ๊ธฐ๋ณธ ์ง์, ๊ฐ์ฅ ๊ฐ๋ ฅํ ๋น์์ด ์ง์, 76% HumanEval.
- ์ด๋ฏธ์ง ์ดํด: `ollama run gemma4:e4b` -- ๋น์ + ๋๊ตฌ ํธ์ถ(2026๋ 6์). ๋๋ ์ ์ฉ ๋น์ ์ฉ `ollama run llama3.2-vision:11b`.
- ๋น ๋ฅด๊ณ ๊ฒฝ๋: `ollama run gemma2:2b` -- ๊ฐ์ฅ ๋น ๋ฅธ CPU ์ถ๋ก , 1.7GB RAM.
- ๊ณ ํ์ง(16GB RAM): `ollama run mistral-small3.1` -- 14GB RAM์์ ~70B๊ธ ํ์ง.
- ์๋ฒ ๋ฉ ์์ฑ: `ollama run nomic-embed-text` -- RAG ํ์ดํ๋ผ์ธ์ฉ 1์ต 3,700๋ง ํ๋ผ๋ฏธํฐ ์๋ฒ ๋ฉ ๋ชจ๋ธ.
- ๋ฌธ์ Q&A(RAG): Open WebUI์ RAG ๊ธฐ๋ฅ๊ณผ ํจ๊ป `ollama run llama3.2` -- ๊ฐ์ฅ ์ ์ง์๋๋ ์กฐํฉ.
- ํ ์๋ํ / ์จ์ดํฌ ์๋ AI: `ollama run phi4-mini` โ Phi-4 Mini(3.8B, ~3GB VRAM)๋ ๋ ๋ฆฝ GPU ์์ด ๋ฏธ๋ PC์์ 20~25 tok/sec๋ก Home Assistant ์์ฑ ์ฟผ๋ฆฌ๋ฅผ ์ฒ๋ฆฌํฉ๋๋ค. Home Assistant + Ollama ํตํฉ ๊ฐ์ด๋ โ ์ฐธ์กฐ.
์ ๊ท Ollama ๋ชจ๋ธ โ 2026๋ 6์ ๋ฆด๋ฆฌ์ค
์ํฌํ๋ก๋ฅผ ๊ตฌ์ถํ๊ธฐ ์ ์ `ollama pull <model>`๋ก ๊ฐ์ฉ์ฑ์ ํ์ธํ์ญ์์ค. ์ ๋ชจ๋ธ์ ์ถ์ ํ ๋ฉฐ์น ๋ด์ ollama.com/library์ Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋ฑ์ฅํฉ๋๋ค.
| Model | Released | Best For | Ollama Command |
|---|---|---|---|
| kimi-k2.6 | 2026๋ 4์ 20์ผ | ์ต์ ์ ์ฝ๋ฉ(SWE-Bench Pro 58.6), MoE(32B/1T), Modified MIT | ollama run kimi-k2.6 |
| qwen3.6:27b | 2026๋ 4์ 16์ผ | ์๋น์ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ , 77.2% SWE-bench, Q4์์ 24GB ์ ํฉ | ollama run qwen3.6:27b |
| qwen3:30b | 2026๋ | ๊ท ํ์กํ ๋ฒ์ฉ; ์ฝ๋ ์์ฑ์๋ qwen3-coder:30b | ollama run qwen3:30b |
| gpt-oss:20b | 2026๋ | ์ํ ์ต๊ฐ / 16GB, ~o3-mini, ์กฐ์ ๊ฐ๋ฅํ ์ถ๋ก (gpt-oss:120b๋ ์์) | ollama run gpt-oss:20b |
| glm-5.1 | 2026๋ 4์ 7์ผ | Z.ai, 744B/40B ํ์ฑ MoE, MIT, SWE-Bench Pro 58.4 | ollama run glm-5.1 |
| gemma4:e4b | 2026๋ 4์ 2์ผ | ๋น์ + ๋๊ตฌ ํธ์ถ(E2B/E4B/E12B/E27B) | ollama run gemma4:e4b |
| deepseek-v4-flash | 2026๋ 4~5์ | ์ ๋น์ฉ ์ฝ๋ฉ(์ค์ธ๊ณ 78/100) | ollama run deepseek-v4-flash |
| qwen3:7b | 2026๋ | 7B์์ HumanEval 76%, ๋ค๊ตญ์ด | ollama run qwen3:7b |
DeepSeek-R1์ด๋ ๋ฌด์์ด๋ฉฐ ์ด๋ป๊ฒ ๋ค๋ฆ ๋๊น?
DeepSeek-R1์ ์ถ๋ก ๋ชจ๋ธ์ ๋๋ค -- ๋ต๋ณ์ ์ง์ ์์ฑํ๋ ํ์ค ์ฑํ ๋ชจ๋ธ๊ณผ ๋ฌ๋ฆฌ, DeepSeek-R1์ ์ต์ข ๋ต๋ณ ์ ์ ๋ช ์์ ์ธ ์ฐ์ ์ฌ๊ณ ์ถ๋ก ์ ์์ฑํฉ๋๋ค. ์ด๋ฅผ ํตํด ์ํ, ๋ ผ๋ฆฌ ํผ์ฆ, ๋จ๊ณ๋ณ ๋ฌธ์ ํด๊ฒฐ์์ ์ฑ๋ฅ์ด ํฌ๊ฒ ํฅ์๋ฉ๋๋ค.
DeepSeek-R1 7B๋ ๊ฒฝ์ ์ํ(MATH)์์ 52%๋ฅผ ๊ธฐ๋กํ๋ ๋ฐ๋ฉด, ๊ฐ์ ํฌ๊ธฐ์ Mistral Small์ 28%์ ๊ทธ์นฉ๋๋ค. ํ์ค ๋ชจ๋ธ๋ณด๋ค ๋๋ฆฌ์ง๋ง(์๋ต๋น ํ ํฐ ์๊ฐ ๋ง์) ์ถ๋ก ์ด ์ค์ํ ์์ ์์ ํจ์ฌ ๋ ์ ํํฉ๋๋ค.
# DeepSeek-R1 Pull ๋ฐ ์คํ
ollama run deepseek-r1:7b
# ๋ ๋์ ํ์ง์ ์ํ ๋ํ ๋ณํ
ollama run deepseek-r1:14b # 10GB RAM
ollama run deepseek-r1:32b # 20GB RAMOllama ๋ชจ๋ธ ์ค ์ด๋ฏธ์ง ์ ๋ ฅ์ ์ง์ํ๋ ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น?
2026๋ 6์ ๊ธฐ์ค, Ollama์์ ์ด๋ฏธ์ง ์ ๋ ฅ(๋ฉํฐ๋ชจ๋ฌ)์ ์ง์ํ๋ ๋ชจ๋ธ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค: Gemma 4๋ ๋น์ ๊ณผ ๋๊ตฌ ํธ์ถ์ ๋ชจ๋ ์ง์ํฉ๋๋ค โ Ollama์ ๋น์ ๋ชจ๋ธ ์ค ์ ์ผํฉ๋๋ค.
| Model | RAM | Image Support | Ollama Command |
|---|---|---|---|
| llama3.2-vision:11b | ~8GB | ์ | ollama run llama3.2-vision:11b |
| llama3.2-vision:90b | ~55GB | ์ | ollama run llama3.2-vision:90b |
| gemma3:9b (vision) | ~6GB | ์ | ollama run gemma3:9b |
| minicpm-v:8b | ~5.5GB | ์ | ollama run minicpm-v |
| gemma4:e4b | ~6GB | ์ + ๋๊ตฌ ํธ์ถ โ | ollama run gemma4:e4b |
Ollama ์ต๊ณ ์คํ์์ค ๋ชจ๋ธ 10๊ฐ๋ ๋ฌด์์ ๋๊น?
ํํ ๋ฆฌ์ผ์ด ๋ง์ Llama 3.x์ ๋ค์ด๋ก๋ ์๋ ์ฌ์ ํ ๋์ต๋๋ค. 2026๋ 6์ ์ ๊ท ํ๋ก์ ํธ์๋ Qwen 3.6 27B(์๋น์ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ ), Kimi K2.6, gpt-oss:20b, qwen3:30b๋ฅผ ๊ถ์ฅํฉ๋๋ค.
| # | Model | Best For | RAM | HumanEval |
|---|---|---|---|---|
| 1 | Qwen 3.6 27B | ์๋น์ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ | 24GB (Q4) | 77.2% SWE-bench |
| 2 | Kimi K2.6 | ์ต์ ์ ์ฝ๋ฉ, MoE(32B/1T), Modified MIT | ์์ํ | 58.6 SWE-Bench Pro |
| 3 | gpt-oss:20b | ์ํ ์ต๊ฐ / 16GB, ์กฐ์ ๊ฐ๋ฅํ ์ถ๋ก | 16GB | ~o3-mini |
| 4 | qwen3:30b | ๊ท ํ์กํ ๋ฒ์ฉ; ์ฝ๋์๋ qwen3-coder:30b | ~18GB | ๊ฐ๋ ฅ |
| 5 | Devstral Small 24B | ์์ด์ ํธ ์ฝ๋ฉ(๋ค์ค ํ์ผ) | 16GB | 80% |
| 6 | deepseek-r1:7b | ์ถ๋ก , ์ํ | 5GB | โ |
| 7 | gemma4:e4b | ๋น์ + ๋๊ตฌ ํธ์ถ(๋ฉํฐ๋ชจ๋ฌ) | ~6GB | โ |
| 8 | Llama 4 Scout | ๊ธด ์ปจํ ์คํธ 10M + ๋ฉํฐ๋ชจ๋ฌ, MoE | ~55GB (Q4) | 85% |
| 9 | mistral-small3.1 | 16GB์์ ๊ณ ํ์ง | 14GB | 74% |
| 10 | Llama 3.2 3B | ์ฒซ ๋ฒ์งธ ๋ชจ๋ธ, ์ผ๋ฐ ์ฑํ | 2.5GB | 60% |
Ollama ๋ชจ๋ธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ด๋ป๊ฒ ํ์ํฉ๋๊น?
Ollama ๋ชจ๋ธ์ ํ์ฉํ๋ ๋ ๊ฐ์ง ๋ฐฉ๋ฒ์ด ์์ต๋๋ค. ์ค์น๋ ๋ชจ๋ธ ์ ํ: Ollama Mac ์ฑ์์ ์ฑํ ์ ๋ ฅ์ฐฝ ํ๋จ์ ๋ชจ๋ธ ๋๋กญ๋ค์ด ๋ฒํผ(ํ์ฌ ๋ชจ๋ธ ์ด๋ฆ ํ์, ์: "gemma3:1b")์ ํด๋ฆญํ์ฌ ๋ก์ปฌ์ ์ค์น๋ ๋ชจ๋ธ ๊ฐ์ ์ ํํฉ๋๋ค. ์ ๋ชจ๋ธ ์ฐพ๊ธฐ ๋ฐ ๋ค์ด๋ก๋: ollama.com/library๋ฅผ ๋ฐฉ๋ฌธํ์ฌ ์นดํ ๊ณ ๋ฆฌ๋ณ๋ก 4,500๊ฐ ์ด์์ ๋ชจ๋ธ์ ํ์ํ ํ, ์๋ CLI ๋ช ๋ น์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ Pullํ๊ณ ๊ด๋ฆฌํฉ๋๋ค.
# ๋ก์ปฌ์ ๋ค์ด๋ก๋๋ ๋ชจ๋ ๋ชจ๋ธ ๋ชฉ๋ก
ollama list
# ๋ชจ๋ธ ๊ฒ์ ๋ฐ Pull
ollama pull qwen2.5-coder:32b
# ๋ชจ๋ธ์ ๋ชจ๋ ์ฌ์ฉ ๊ฐ๋ฅํ ํ๊ทธ ํ์ธ
ollama show qwen2.5
# ๋์คํฌ ๊ณต๊ฐ ํ๋ณด๋ฅผ ์ํด ๋ชจ๋ธ ์ ๊ฑฐ
ollama rm llama3.2:3b์คํ์์ค Ollama ๋ชจ๋ธ: ์ง์ญ๋ณ ๋งฅ๋ฝ
EU / GDPR + ๋ผ์ด์ ์ค ์ค์. ํ๋ก๋์ ์ Ollama ๋ชจ๋ธ์ ๋ฐฐํฌํ๋ EU ์กฐ์ง์ ๊ฒฝ์ฐ, ์ฑ๋ฅ๋งํผ์ด๋ ๋ผ์ด์ ์ค ์ ํ์ด ์ค์ํฉ๋๋ค. Apache 2.0(์์ ๊ฐ๋ฐฉ, ์์ ์ ์ด์ฉ ํ์ฉ): Mistral Small, Mistral Small 3.1, Qwen3 7B, Qwen 3.6 27B, Devstral Small 24B, Gemma 2 2B. Meta Llama Community Licence(์๊ฐ ํ์ฑ ์ฌ์ฉ์ 7์ต ๋ช ์ด๊ณผ ์ ์์ ์ ์ด์ฉ ์ ํ): Llama 3.3 8B, Llama 3.2 3B, Llama 3.2 Vision 11B. MIT(์์ ์ ์ด์ฉ ํ์ฉ): DeepSeek-R1 7B, DeepSeek-R1 14B. Modified MIT(๊ท์ ์กฐํญ์ด ์๋ ์์ ์ ์ด์ฉ ํ์ฉ): Kimi K2.6. ๊ท์ ๋ถ์ผ์ EU ๊ธฐ์ ์๋ Mistral ๋ชจ๋ธ(ํ๋์ค, Apache 2.0) ๋๋ Devstral Small 24B(์ต๊ณ ์์ด์ ํธ ์ฝ๋ฉ)๊ฐ ๊ธฐ๋ณธ ๊ถ์ฅ ์ฌํญ์ ๋๋ค -- EU ์ถ์ฒ, ํด๋ฆฐ ๋ผ์ด์ ์ค, ์์ ์ ๋ฐฐํฌ ์ ํ ์์. GDPR ์ค์: ๋ชจ๋ ๋ชจ๋ธ์ด Ollama๋ฅผ ํตํด ์์ ํ ์จํ๋ ๋ฏธ์ค์์ ์คํ๋๋ฏ๋ก, ๋ชจ๋ธ ์ ํ์ ๊ด๊ณ์์ด ์ธ๋ถ ์๋ฒ๋ก ๊ฐ์ธ ๋ฐ์ดํฐ๊ฐ ์ ์ก๋์ง ์์ต๋๋ค.
์ผ๋ณธ(METI). ์ผ๋ณธ ๊ธฐ์ ์ Ollama ๋ฐฐํฌ์๋ Qwen3 / Qwen 3.6 ๋ชจ๋ธ ๊ณ์ด์ด ๊ถ์ฅ๋ฉ๋๋ค -- ๊ธฐ๋ณธ ์ผ๋ณธ์ด ํ ํฌ๋์ด์ ์ด์ ์ด Llama๋ Mistral๋ณด๋ค ์ผ๋ณธ์ด ํ ์คํธ๋ฅผ 30~40% ๋ ํ ํฐ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ์ฌ ์ถ๋ก ์๊ฐ๊ณผ KV ์บ์ ์๊ตฌ ์ฌํญ์ ์ง์ ์ ์ผ๋ก ์ค์ ๋๋ค. ์ผ๋ณธ์ด ์ฝ๋ฉ ์ํฌํ๋ก: Qwen 3.6 27B(77.2% SWE-bench)๋ ์ผ๋ณธ์ด ์ฝ๋ ์ฃผ์์ ๊ธฐ๋ณธ์ผ๋ก ์ฒ๋ฆฌํ๋ฉฐ 2026๋ ์ต๊ณ ๋ฐ์ง ์ฝ๋ฉ ๋ชจ๋ธ์ ๋๋ค. METI AI ๊ฑฐ๋ฒ๋์ค ๋ฌธ์ํ ์ ์ ํํ ๋ชจ๋ธ ๋ฒ์ ์ ๊ธฐ์ฌํด์ผ ํฉ๋๋ค. `ollama show <model>`์ ์ฌ์ฉํ์ฌ ๊ท์ ์ค์ ๊ธฐ๋ก์ ์ํ ํ๋ผ๋ฏธํฐ ์, ์์ํ ๋ ๋ฒจ, ์ปจํ ์คํธ ๊ธธ์ด๋ฅผ ํฌํจํ ์ ์ฒด ๋ชจ๋ธ ์ฌ์์ ํ์ธํ์ญ์์ค.
์ค๊ตญ. ์ค๊ตญ์ CAC ์์ฑํ AI ์กฐ์น(2023๋ )์ ๋ฐ๋ผ, ์ต์ข ์ฌ์ฉ์์๊ฒ AI ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ์กฐ์ง์ ์ฌ์ฉํ๋ ๋ชจ๋ธ์ ๋ฑ๋กํด์ผ ํฉ๋๋ค. Qwen3 / Qwen 3.6(Alibaba, Apache 2.0)์ ์ค๊ตญ ๊ธฐ์ ์ Ollama ๋ฐฐํฌ์ ๊ถ์ฅ๋ฉ๋๋ค -- ์ค๊ตญ ๋ชจ๋ธ ์ถ์ฒ, Apache 2.0 ๋ผ์ด์ ์ค, ์ค๊ตญ์ด ์์ ์ต๊ณ ์ฑ๋ฅ, ์ต์์ ๋ฒค์น๋งํฌ. Kimi K2.6(Moonshot AI, Modified MIT ๋ผ์ด์ ์ค, 32B ํ์ฑ/1T ์ ์ฒด MoE)๋ ์ค๊ตญ ์ถ์ฒ์ ์ต์์ ์ฝ๋ฉ ์ต์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํฉ๋๋ค. Pull ๋ช ๋ น: ์ต๊ณ ํ์ง์๋ `ollama run qwen3.6:27b`, ๋น ๋ฅธ ์๋์๋ `ollama run qwen3:7b`. ์ถ๋ก ์์ ์๋ DeepSeek-R1(DeepSeek, MIT ๋ผ์ด์ ์ค)์ด ์ ํฉํฉ๋๋ค. Ollama๋ฅผ ํตํด ๋ก์ปฌ๋ก ์ฒ๋ฆฌ๋๋ ๋ฐ์ดํฐ์ ๊ฒฝ์ฐ, ์ค๊ตญ์ PIPL ๊ตญ๊ฒฝ ๊ฐ ๋ฐ์ดํฐ ์ด์ ์๊ตฌ ์ฌํญ์ด ์ ์ฉ๋์ง ์์ต๋๋ค -- ์ถ๋ก ์ด ์จํ๋ ๋ฏธ์ค์์ ์ ์ง๋ฉ๋๋ค.
Ollama ๋ชจ๋ธ ์ ํ ์ ํํ ์ค์๋ ๋ฌด์์ ๋๊น?
RAM ํ์ธ ์์ด ๊ธฐ๋ณธ์ ์ผ๋ก ๊ฐ์ฅ ํฐ ๋ชจ๋ธ ํ๊ทธ๋ฅผ Pullํ๋ ๊ฒฝ์ฐ
ํ๊ทธ ์์ด `ollama pull llama3.3`์ ์คํํ๋ฉด ์ผ๋ฐ์ ์ผ๋ก ๊ฐ์ฅ ํฐ ํ์ค ์์ํ ๋ณํ์ด ๋ค์ด๋ก๋๋ฉ๋๋ค. 8GB RAM ๊ธฐ๊ธฐ์์ llama3.3(70B, ~40GB)์ Pullํ๋ฉด ์คํจํ๊ฑฐ๋ ์ฌ๊ฐํ ์ค์ ์ฌ์ฉ์ด ๋ฐ์ํฉ๋๋ค. ํญ์ ๋ณํ์ ์ง์ ํ์ญ์์ค: 8GB ๊ธฐ๊ธฐ์๋ `ollama pull llama3.2:3b`.
์์ ๋ณ ํนํ ๋ชจ๋ธ์ด ์์ ๋ ๋ฒ์ฉ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ
์ฝ๋ฉ ์์ ์ ๊ฒฝ์ฐ, `qwen2.5-coder:7b`๋ 72% HumanEval์ ๊ธฐ๋กํ๊ณ ๋ฒ์ฉ `qwen2.5:7b`๋ 72%๋ฅผ ๊ธฐ๋กํ์ง๋ง -- `qwen2.5-coder`๋ ์ฝ๋ ์์ฑ์ ์ํ FIM ์ง์์ด ํฌํจ๋ฉ๋๋ค. ์ถ๋ก /์ํ์์๋ `deepseek-r1:7b`๊ฐ MATH์์ 52%, `mistral:7b`๋ 28%๋ฅผ ๊ธฐ๋กํฉ๋๋ค. Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ์์ ๋ณ ํนํ ๋ชจ๋ธ์ด ์กด์ฌํ๋ ์ด์ ๊ฐ ์์ต๋๋ค.
์ํฌํ๋ก ๊ตฌ์ถ ์ ์ ๋ชจ๋ธ ๊ฐ์ฉ์ฑ์ ํ์ธํ์ง ์๋ ๊ฒฝ์ฐ
Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ๋ณ๊ฒฝ๋ฉ๋๋ค -- ๋ชจ๋ธ์ด ์ถ๊ฐ๋๊ณ ๊ฐํน ์ ๊ฑฐ๋ฉ๋๋ค. ํน์ ๋ชจ๋ธ ๊ธฐ๋ฐ์ ํ๋ก๋์ ํ์ดํ๋ผ์ธ์ ๊ตฌ์ถํ๊ธฐ ์ ์, ํด๋น ๋ชจ๋ธ์ด ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ์๋์ง ํ์ธํ์ญ์์ค(๋ก์ปฌ์์ `ollama list`, ๋๋ ollama.com/library ํ์ธ). ํ๋ก๋์ ์ํฌํ๋ก์์๋ ํน์ ๋ชจ๋ธ ๋ฒ์ ์ ๊ณ ์ ํ์ญ์์ค: `ollama pull llama3.1:8b-instruct-q4_K_M`.
๋ํ ๋ชจ๋ธ์ ์์ํ ํ๊ทธ๋ฅผ ์ง์ ํ์ง ์๋ ๊ฒฝ์ฐ
์์ํ ์ ๋ฏธ์ฌ ์์ด `ollama pull qwen2.5-coder:32b`๋ฅผ ์คํํ๋ฉด VRAM์ด ์ฒ๋ฆฌํ ์ ์๋ ํฌ๊ธฐ์ ๊ธฐ๋ณธ ๋ณํ์ด ๋ค์ด๋ก๋๋ ์ ์์ต๋๋ค. 16GB VRAM์์๋ ๋ช ์์ Q4_K_M ๋ณํ์ Pullํ์ญ์์ค: `ollama pull qwen2.5-coder:32b-instruct-q4_K_M`. Pull ํ `ollama show <model>`์ ์คํํ์ฌ VRAM ์๊ตฌ ์ฌํญ์ด ํ๋์จ์ด์ ์ผ์นํ๋์ง ํ์ธํ์ญ์์ค.
DeepSeek-R1์ด ํ์ค ์ฑํ ๋ชจ๋ธ๋งํผ ๋น ๋ฅผ ๊ฒ์ผ๋ก ๊ธฐ๋ํ๋ ๊ฒฝ์ฐ
DeepSeek-R1์ ์ต์ข ๋ต๋ณ ์ ์ ๋ช ์์ ์ธ ์ฐ์ ์ฌ๊ณ ์ถ๋ก ํ ํฐ์ ์์ฑํฉ๋๋ค -- ์ด๊ฒ์ด ์ํ๊ณผ ๋ ผ๋ฆฌ์์ ํ์ค ๋ชจ๋ธ๋ณด๋ค ๋ฐ์ด๋ ์ด์ ์ด์ง๋ง, ์๋ต๋น 3~5๋ฐฐ ๋ ๋ง์ ํ ํฐ์ ์์ฑํฉ๋๋ค. ๋น ๋ฅธ ์ฑํ ์ด๋ ํ ์ค ๋ต๋ณ์๋ `llama3.1:8b`๋ฅผ ์ฌ์ฉํ์ญ์์ค. ์ถ๋ก ์ ํ๋๊ฐ ์๋๋ณด๋ค ์ค์ํ ์์ ์๋ DeepSeek-R1์ ํ์ฉํ์ญ์์ค.
Ollama ์คํ์์ค ๋ชจ๋ธ์ ๊ดํ ์์ฃผ ๋ฌป๋ ์ง๋ฌธ
Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ์๋ ๋ช ๊ฐ์ ๋ชจ๋ธ์ด ์์ต๋๊น?
2026๋ 6์ ๊ธฐ์ค, Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ์๋ ๊ณต์ ์ง์์ ๋ฐ๋ ์ฝ 4,500๊ฐ ์ด์์ ๋ชจ๋ธ(ํ๋ ์ดํ ๋ ๋ชจ๋ธ + ์ปค๋ฎค๋ํฐ ๊ธฐ์ฌ)์ด ์์ต๋๋ค. Hugging Face์๋ ์ปค์คํ Modelfile์ ํตํด Ollama๋ก ๋ก๋ํ ์ ์๋ ์์ฒ ๊ฐ์ ์ถ๊ฐ GGUF ๋ชจ๋ธ์ด ์์ต๋๋ค.
Hugging Face ๋ชจ๋ธ์ Ollama์์ ์ง์ ์ฌ์ฉํ ์ ์์ต๋๊น?
์. Hugging Face์์ GGUF ํ์ผ์ ๋ค์ด๋ก๋ํ๊ณ Modelfile์ ์์ฑํ์ญ์์ค: `FROM ./model.gguf`. ๊ทธ๋ฐ ๋ค์ `ollama create mymodel -f Modelfile`์ ์คํํฉ๋๋ค. ์ด๋ ๊ณต์ Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ์๋ ํ์ธํ๋ ๋ชจ๋ธ ๋ฐ ๋ชจ๋ธ์ ํฌํจํ์ฌ ๋ชจ๋ GGUF ํ์ผ์์ ์๋ํฉ๋๋ค.
๋ก์ปฌ ์ฑ๋ด ๊ตฌ์ถ์ ๊ฐ์ฅ ์ ํฉํ Ollama ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น?
๋ฒ์ฉ ๋ก์ปฌ ์ฑ๋ด: `qwen3.6:27b`(์๋น์ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ , Q4์์ 24GB์ ์ ํฉ), ๋๋ 8GB RAM์์๋ `llama3.2:3b`(๊ฐ์ฅ ์ฌ์ด ์์์ ). 16GB ๊ธฐ๊ธฐ: `gpt-oss:20b`(~o3-mini ์์ค) ๋๋ `mistral-small3.1`. ์ฝ๋ฉ ์ด์์คํดํธ ์ฑ๋ด: `qwen3.6:27b`(77.2% SWE-bench), `kimi-k2.6`(์ต์ ์ MoE), ๋๋ `devstral-small:24b`(์์ด์ ํธ ์ฝ๋ฉ). localhost:11434์ Ollama API์ ์ฐ๊ฒฐ๋๋ ์น ๊ธฐ๋ฐ ์ธํฐํ์ด์ค์ธ Open WebUI์ ํจ๊ป ์ฌ์ฉํ์ญ์์ค.
๋ชจ๋ Ollama ๋ชจ๋ธ์ด ์ง์ ํ ์คํ์์ค์ ๋๊น?
๊ทธ๋ ์ง ์์ต๋๋ค. Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ์๋ ๋ค์ํ ๋ผ์ด์ ์ค์ ๋ชจ๋ธ์ด ํฌํจ๋์ด ์์ต๋๋ค. Llama 3.x/4.x๋ Meta Llama Community Licence๋ฅผ ์ฌ์ฉํฉ๋๋ค(OSI ์น์ธ ์คํ์์ค ์๋ -- ์๊ฐ ํ์ฑ ์ฌ์ฉ์ 7์ต ๋ช ์ด๊ณผ ์ ์์ ์ ์ด์ฉ ์ ํ). Mistral Small, Qwen3, Qwen 3.6, Devstral, Gemma ๋ชจ๋ธ์ Apache 2.0(์์ ์คํ์์ค)์ ๋๋ค. Kimi K2.6์ Modified MIT ๋ผ์ด์ ์ค(๊ท์ ์กฐํญ์ด ์๋ ์์ ์ ์ด์ฉ ํ์ฉ)์ ๋๋ค. ์์ ์ ๋ฐฐํฌ ์ ์ ํญ์ ๋ผ์ด์ ์ค๋ฅผ ํ์ธํ์ญ์์ค.
RAG๋ฅผ ์ํด Ollama์์ ์ฌ์ฉํด์ผ ํ๋ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น?
`nomic-embed-text`๊ฐ ํ์ค ์ ํ์ ๋๋ค -- 768์ฐจ์ ์๋ฒ ๋ฉ์ ์์ฑํ๊ณ , ๋ฌธ์๋น ๋ฐ๋ฆฌ์ด ๋จ์๋ก ์คํ๋๋ฉฐ, ๊ฒ์ ์์ ์ ํนํ๋ 1์ต 3,700๋ง ํ๋ผ๋ฏธํฐ ๋ชจ๋ธ์ ๋๋ค. `ollama pull nomic-embed-text`๋ก Pullํ์ญ์์ค. Open WebUI์ ๋ด์ฅ RAG, LangChain์ OllamaEmbeddings, ๋๋ LlamaIndex์ ํจ๊ป ์ฌ์ฉํ์ญ์์ค.
Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ ์ผ๋ง๋ ์์ฃผ ์ ๋ชจ๋ธ๋ก ์ ๋ฐ์ดํธ๋ฉ๋๊น?
Ollama ํ์ ์ฃผ์ ๋ฆด๋ฆฌ์ค ํ ๋ฉฐ์น ์์ ๋ช ์ฃผ ๋ด์ ์ ๋ชจ๋ธ์ ์ถ๊ฐํฉ๋๋ค. Kimi K2.6๊ณผ Qwen 3.6์ 2026๋ 4์ ๋ฆด๋ฆฌ์ค ํ ๋ฉฐ์น ๋ด์ ๋ฑ์ฅํ์ต๋๋ค. Ollama v0.24.0(2026๋ 5์ 14์ผ)์ Gemma 4 ๋ ๋๋ง ๊ฐ์ ์ ์ถ๊ฐํ์ต๋๋ค. ์ ๋ชจ๋ธ ๋ฐํ๋ฅผ ์ํด Ollama GitHub ์ ์ฅ์(github.com/ollama/ollama) ๋๋ Ollama Twitter/X ๊ณ์ ์ ํ๋ก์ฐํ์ญ์์ค.
`ollama pull`๊ณผ `ollama run`์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
`ollama pull`์ ๋ชจ๋ธ ํ์ผ์ ๋ก์ปฌ ์คํ ๋ฆฌ์ง์ ๋ค์ด๋ก๋ํฉ๋๋ค(1ํ ์์ ). `ollama run`์ Pull ํ ์ฆ์ ๋ํํ ์ธ์ ์ ์์ํ๊ฑฐ๋, ์ด๋ฏธ Pull๋ ๋ชจ๋ธ์ด ์์ผ๋ฉด ์ฌ์ฌ์ฉํฉ๋๋ค. ํ ๋ฒ Pullํ๊ณ ์ฌ๋ฌ ๋ฒ ์คํํ ์ ์์ผ๋ฉฐ ์ฌ๋ค์ด๋ก๋๊ฐ ํ์ํ์ง ์์ต๋๋ค.
๊ฐ์ ๊ธฐ๊ธฐ์์ ์ฌ๋ฌ ๋ชจ๋ธ์ ๋์์ ์คํํ ์ ์์ต๋๊น?
์, ํ๋์จ์ด์ ์ถฉ๋ถํ VRAM์ด ์๋ ๊ฒฝ์ฐ. ๋ณ๋์ ํฐ๋ฏธ๋ ์ฐฝ์ด๋ ์ ์ธ์ ์ ์ฌ์ฉํ์ญ์์ค -- ํ ์ฐฝ์์ `ollama run llama3.2`๋ฅผ ์คํํ๊ณ ๋ค๋ฅธ ์ฐฝ์์ `ollama run qwen2.5:7b`๋ฅผ ์คํํฉ๋๋ค. Ollama๋ VRAM ๊ณต์ ๋ฅผ ์๋์ผ๋ก ๊ด๋ฆฌํฉ๋๋ค. ๊ณผ๋ถํ๋ฅผ ๋ฐฉ์งํ๊ธฐ ์ํด `nvidia-smi`๋ ์์คํ ํ๋์ ๋ชจ๋ํฐ๋งํ์ญ์์ค.
๋ชจ๋ธ์ ์ต์ ๋ฒ์ ์ผ๋ก ์ ๋ฐ์ดํธํ๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ ๋๊น?
`ollama pull [model-name]`์ ์ ๋ฐ์ดํธ๋ฅผ ํ์ธํ๊ณ ๊ฐ์ฉํ ๊ฒฝ์ฐ ์ต์ ๋ฒ์ ์ ๋ค์ด๋ก๋ํฉ๋๋ค. ์ด์ ๋ฒ์ ์ผ๋ก ๋๋๋ฆฌ๊ฑฐ๋ ํน์ ๋ฒ์ ์ ์ฌ์ฉํ๋ ค๋ฉด ๋ฒ์ ํ๊ทธ๋ฅผ ์ฌ์ฉํ์ญ์์ค: `ollama pull llama3.1:8b` ๋๋ `ollama pull llama3.1:8b-instruct-q4_K_M`. `ollama show [model-name]`์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ ๋ฒ์ ์ ํ์ธํ์ญ์์ค.
Ollama์ ์คํ์์ค ๋ชจ๋ธ์ ์์ ์ ์ผ๋ก ๋ฌด๋ฃ๋ก ์ฌ์ฉํ ์ ์์ต๋๊น?
๋๋ถ๋ถ์ ๊ทธ๋ ์ง๋ง ์ ๋ถ๋ ์๋๋๋ค. Llama 3.x(Meta Llama Community Licence)๋ ์๊ฐ ํ์ฑ ์ฌ์ฉ์ 7์ต ๋ช ์ด๊ณผ ์ ์์ ์ ์ด์ฉ์ ์ ํํฉ๋๋ค. Mistral Small, Qwen3, Gemma ๋ชจ๋ธ์ Apache 2.0(์์ ์์ ์ ์ด์ฉ ํ์ฉ)์ ์ฌ์ฉํฉ๋๋ค. ๊ธฐ์ ๋ฐฐํฌ ์ ์ ํญ์ ๋ผ์ด์ ์ค๋ฅผ ํ์ธํ์ญ์์ค -- ๋ชจ๋ธ์ Hugging Face ํ์ด์ง๋ Ollama ๋ผ์ด๋ธ๋ฌ๋ฆฌ ํญ๋ชฉ์ ํ์ธํ์ญ์์ค.
์ถ์ฒ
- Meta AI. (2025). "Llama 4 Model Card." llama.meta.com -- Llama 4 Scout(17B ํ์ฑ, 109B ์ ์ฒด, MoE)์ Maverick ๋ณํ์ ๊ณต์ ์ฌ์.
- DeepSeek AI. (2025). "DeepSeek-R1 Technical Report." arxiv.org/abs/2501.12948 -- DeepSeek-R1์ ์ฐ์ ์ฌ๊ณ ์ํคํ ์ฒ์ MATH ๋ฒค์น๋งํฌ(52%).
- Qwen Team. (2026). "Qwen 3.6 Technical Report." arxiv.org/abs/2501.xxxxx -- ์ต๊ณ ๋ฐ์ง ์ฝ๋ฉ ๋ชจ๋ธ๋ก์ 77.2% SWE-bench.
- Moonshot AI. (2026). "Kimi K2.6 Model Card." moonshot.ai -- Modified MIT ๋ผ์ด์ ์ค MoE ์ฝ๋ฉ ๋ชจ๋ธ(32B ํ์ฑ/1T ์ ์ฒด), SWE-Bench Pro 58.6.
- Mistral AI. (2026). "Devstral Small 24B." mistral.ai -- ๋ค์ค ํ์ผ ํธ์ง ๋ฐ ๋๋ฒ๊น ์ ์ํ ์ต๊ณ ์์ด์ ํธ ์ฝ๋ฉ ๋ชจ๋ธ.
- Ollama. (2026). "Ollama Model Library." ollama.com/library -- 4,500๊ฐ ์ด์์ ๋ชจ๋ธ, ๋ค์ด๋ก๋ ์, ํ๊ทธ, ์์ํ ์ต์ ์ด ์๋ ๊ณต์ ๋ชจ๋ธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ.
- Google DeepMind. (2026). "Gemma 4 Technical Report." -- 2026๋ 4์ ์ถ์๋ ๋น์ + ๋๊ตฌ ํธ์ถ ๊ธฐ๋ฅ.