Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/Ollama ์ปจํ…์ŠคํŠธ ์ฐฝ ์„ค์ •: Strix Halo, RTX, Mac์—์„œ 64K~1M ํ† ํฐ (2026)
Best Models

Ollama ์ปจํ…์ŠคํŠธ ์ฐฝ ์„ค์ •: Strix Halo, RTX, Mac์—์„œ 64K~1M ํ† ํฐ (2026)

ยท8๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

Llama 4 Scout๋Š” ์ตœ๋Œ€ 1,000๋งŒ ํ† ํฐ ์ปจํ…์ŠคํŠธ๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค(์†Œ๋น„์ž์šฉ ํ•˜๋“œ์›จ์–ด์—์„œ ์‹ค์šฉ์  ๋ฒ”์œ„: 256K~1M). DeepSeek V4-Flash๋Š” 1M ํ† ํฐ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. Qwen 3.6์€ ๊ธฐ๋ณธ์ ์œผ๋กœ 256K ํ† ํฐ์„ ์ง€์›ํ•˜๋ฉฐ YaRN์„ ํ†ตํ•ด 1M๊นŒ์ง€ ํ™•์žฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 7B~8B ๋ชจ๋ธ์€ 16K~32K ํ† ํฐ์—์„œ ์•ˆ์ •์ ์œผ๋กœ ๋™์ž‘ํ•˜์ง€๋งŒ, ์ƒˆ๋กœ์šด MoE ๋ชจ๋ธ๊ณผ 70B ์ด์ƒ ๋ชจ๋ธ์€ 256K~1M๊นŒ์ง€ ์‹ค์šฉ์  ํ•œ๊ณ„๋ฅผ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค. Ollama์˜ ๊ธฐ๋ณธ๊ฐ’์€ 2048 ํ† ํฐ์ž…๋‹ˆ๋‹ค. ๊ธด ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•˜๋ ค๋ฉด num_ctx๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค.

2026๋…„ ์ปจํ…์ŠคํŠธ ์ฐฝ ํ˜๋ช…์ด ์‹œ์ž‘๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Llama 4 Scout๋Š” ์ตœ๋Œ€ 1,000๋งŒ ํ† ํฐ ์ปจํ…์ŠคํŠธ๋ฅผ ์ง€์›ํ•˜๋ฉฐ(์‹ค์šฉ์  ๋ฒ”์œ„: 256K~1M), DeepSeek V4-Flash๋Š” 1M ํ† ํฐ์„ ์ œ๊ณตํ•˜๊ณ , Qwen 3.6์€ ๊ธฐ๋ณธ์ ์œผ๋กœ 256K ํ† ํฐ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค(YaRN์„ ํ†ตํ•ด 1M์œผ๋กœ ํ™•์žฅ ๊ฐ€๋Šฅ). ๋Œ€๋ถ€๋ถ„์˜ 7B~8B ๋ชจ๋ธ์€ ์‹ค์šฉ์  ์ปจํ…์ŠคํŠธ๊ฐ€ 16K~32K ์ˆ˜์ค€์— ๋จธ๋ฌผ์ง€๋งŒ, ์ƒˆ๋กœ์šด MoE ๋ชจ๋ธ์€ ์†Œ๋น„์ž์šฉ ํ•˜๋“œ์›จ์–ด์—์„œ 256K~1M ํ† ํฐ๊นŒ์ง€ ํ•œ๊ณ„๋ฅผ ํ™•์žฅํ•ฉ๋‹ˆ๋‹ค. Ollama์˜ ๊ธฐ๋ณธ๊ฐ’์€ 2048 ํ† ํฐ์ž…๋‹ˆ๋‹ค. ์ด ๊ฐ€์ด๋“œ์—์„œ๋Š” ๊ฐ ๋ชจ๋ธ์ด ์ง€์›ํ•˜๋Š” ์ปจํ…์ŠคํŠธ ํฌ๊ธฐ, ๊ฐ ๋‹จ๊ณ„๋ณ„ RAM ์š”๊ตฌ ์‚ฌํ•ญ, ๊ทธ๋ฆฌ๊ณ  ๊ธด ์ปจํ…์ŠคํŠธ ์„ค์ • ๋ฐฉ๋ฒ•์„ ์•ˆ๋‚ดํ•ฉ๋‹ˆ๋‹ค.

Slide Deck: Ollama ์ปจํ…์ŠคํŠธ ์ฐฝ ์„ค์ •: Strix Halo, RTX, Mac์—์„œ 64K~1M ํ† ํฐ (2026)

์•„๋ž˜ ์Šฌ๋ผ์ด๋“œ ๋ฑ์€ ๋‹ค์Œ ๋‚ด์šฉ์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค: 128K ์ปจํ…์ŠคํŠธ ์ฐฝ ๋ชจ๋ธ ๋น„๊ต(Llama 3.3, Qwen3, Mistral Small 3.1), 4K/32K/128K ์ปจํ…์ŠคํŠธ ๊ธธ์ด์—์„œ์˜ RAM ์‚ฌ์šฉ๋Ÿ‰, "์ค‘๊ฐ„ ์†Œ์‹ค" ํšจ๊ณผ์™€ ์‹ค์šฉ์  ์•ˆ์ • ํ•œ๊ณ„(7B ๋ชจ๋ธ์—์„œ ์•ฝ 32K), Ollama์—์„œ num_ctx ์„ค์ • ๋ฐฉ๋ฒ•. ๊ธด ์ปจํ…์ŠคํŠธ ๋กœ์ปฌ LLM ์ฐธ์กฐ ์นด๋“œ๋กœ PDF๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค.

Browse the slides below or download as PDF for offline reference. Download Reference Card (PDF)

Key Takeaways

  • Llama 4 Scout (MoE)๋Š” ์ตœ๋Œ€ 1,000๋งŒ ํ† ํฐ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. DeepSeek V4-Flash์™€ Qwen 3.6์€ ๊ฐ๊ฐ 1M ๋ฐ 256K ํ† ํฐ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค(YaRN์œผ๋กœ 1M ํ™•์žฅ ๊ฐ€๋Šฅ). 2026๋…„ 5์›”์€ ๋ฐฑ๋งŒ ํ† ํฐ ์ฒ˜๋ฆฌ๊ฐ€ ๊ฐ€๋Šฅํ•œ ์˜คํ”ˆ ๋ชจ๋ธ ์ตœ์ดˆ์˜ ์„ธ๋Œ€๊ฐ€ ์‹œ์ž‘๋œ ์‹œ์ ์ž…๋‹ˆ๋‹ค.
  • ๋ชจ๋ธ ํฌ๊ธฐ๋ณ„ ์‹ค์šฉ์  ์ปจํ…์ŠคํŠธ: 7B~8B ๋ชจ๋ธ์€ 16K~32K ํ† ํฐ์—์„œ ํ’ˆ์งˆ์„ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค. 70B ์ด์ƒ ๋ชจ๋ธ๊ณผ MoE ๋ชจ๋ธ์€ 256K~1M๊นŒ์ง€ ํ™•์žฅ๋ฉ๋‹ˆ๋‹ค. Llama 4 Scout๋Š” ์ถฉ๋ถ„ํ•œ VRAM์—์„œ 100๋งŒ ํ† ํฐ ์ „์ฒด ์ปจํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • RAM์€ ์ปจํ…์ŠคํŠธ ๊ธธ์ด์™€ ๋ชจ๋ธ ํฌ๊ธฐ ๋ชจ๋‘์— ๋”ฐ๋ผ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. Q4_K_M์˜ Qwen 3.6 27B๋Š” 128K์—์„œ ์•ฝ 22GB, 1M ํ† ํฐ์—์„œ 65GB ์ด์ƒ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. Llama 4 Scout๋Š” ์ „์ฒด 1,000๋งŒ ํ† ํฐ ์ปจํ…์ŠคํŠธ์— 150GB ์ด์ƒ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
  • "์ค‘๊ฐ„ ์†Œ์‹ค" ํ˜„์ƒ์€ ์—ฌ์ „ํžˆ ์ ์šฉ๋ฉ๋‹ˆ๋‹ค: LLM์€ ์ปจํ…์ŠคํŠธ ์ค‘๊ฐ„ ์„น์…˜์˜ ์„ธ๋ถ€ ์ •๋ณด๋ฅผ ๋†“์นฉ๋‹ˆ๋‹ค. ์™„ํ™” ๋ฐฉ๋ฒ•: ์ค‘์š”ํ•œ ์ •๋ณด๋ฅผ ํ”„๋กฌํ”„ํŠธ ์‹œ์ž‘ ๋ถ€๋ถ„์— ๋ฐฐ์น˜ํ•˜๊ณ , ๊ฒ€์ƒ‰ ์ž‘์—…์—๋Š” RAG๋ฅผ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜, ๊ฒน์น˜๋Š” ์ฒญํฌ๋กœ ๋ถ„ํ•  ์ฒ˜๋ฆฌํ•˜์‹ญ์‹œ์˜ค.
  • ๊ธด ์ปจํ…์ŠคํŠธ๋Š” ์ „์ฒด ๋ฌธ์„œ(์ฝ”๋“œ๋ฒ ์ด์Šค, ๊ณ„์•ฝ์„œ, ์ฑ…)์˜ ์ „์ฒด์  ๋ถ„์„์— ํƒ์›”ํ•ฉ๋‹ˆ๋‹ค. RAG๋Š” ๋‹ค์ˆ˜์˜ ๋ฌธ์„œ์— ๊ฑธ์นœ ๊ฒ€์ƒ‰ ์ค‘์‹ฌ ์ž‘์—…์— ํƒ์›”ํ•ฉ๋‹ˆ๋‹ค. ์ปจํ…์ŠคํŠธ ํฌ๊ธฐ๊ฐ€ ์•„๋‹Œ ์ž‘์—… ์œ ํ˜•์— ๋”ฐ๋ผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.
  • Ollama์˜ ๊ธฐ๋ณธ๊ฐ’์€ 128K๋‚˜ 1M์ด ์•„๋‹Œ 2048 ํ† ํฐ์ž…๋‹ˆ๋‹ค. ์ „์ฒด ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•˜๋ ค๋ฉด Modelfile์—์„œ num_ctx๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค. 500K ์ด์ƒ์˜ ๋Œ€๊ทœ๋ชจ ์ปจํ…์ŠคํŠธ์—์„œ๋Š” OOM์„ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ์–ดํ…์…˜ ๊ตฌํ˜„์„ ํŠœ๋‹ํ•˜์‹ญ์‹œ์˜ค.

์ปจํ…์ŠคํŠธ ๊ธธ์ด๋ž€ ๋ฌด์—‡์ด๋ฉฐ ๋กœ์ปฌ LLM์—์„œ ์™œ ์ค‘์š”ํ•ฉ๋‹ˆ๊นŒ?

์ปจํ…์ŠคํŠธ ๊ธธ์ด๋Š” ๋ชจ๋ธ์ด ๋‹จ์ผ ์ถ”๋ก  ํ˜ธ์ถœ์—์„œ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์ตœ๋Œ€ ํ† ํฐ ์ˆ˜์ž…๋‹ˆ๋‹ค. ์ž…๋ ฅ(๋ฌธ์„œ, ๋Œ€ํ™” ๊ธฐ๋ก, ์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ)๊ณผ ์ถœ๋ ฅ(๋ชจ๋ธ์˜ ์‘๋‹ต)์˜ ํ•ฉ์‚ฐ ํฌ๊ธฐ์ž…๋‹ˆ๋‹ค. ์˜์–ด ๊ธฐ์ค€ 1 ํ† ํฐ โ‰ˆ 0.75 ๋‹จ์–ด์ด๋ฉฐ, 128K ํ† ํฐ โ‰ˆ 96,000 ๋‹จ์–ด์ž…๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM ์‚ฌ์šฉ ์‚ฌ๋ก€์—์„œ ๊ธด ์ปจํ…์ŠคํŠธ๋Š” ๋‹ค์Œ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค: ์ฑ… ์ „์ฒด ๋˜๋Š” ๊ธด ๋ณด๊ณ ์„œ ์š”์•ฝ, ํ•˜๋‚˜์˜ ํ”„๋กฌํ”„ํŠธ๋กœ ์ „์ฒด ์ฝ”๋“œ๋ฒ ์ด์Šค ๋ถ„์„, ์‹œ๊ฐ„ ๋‹จ์œ„์˜ ํšŒ์˜ ๋…น์ทจ๋ก ์ฒ˜๋ฆฌ, ์ด์ „ ์ปจํ…์ŠคํŠธ๋ฅผ ์žƒ์ง€ ์•Š๊ณ  ๊ธด ๋Œ€ํ™” ๊ธฐ๋ก ์œ ์ง€.

ํ•ต์‹ฌ ๊ตฌ๋ถ„์€ ๊ด‘๊ณ ๋œ ์ปจํ…์ŠคํŠธ ๊ธธ์ด(๋ชจ๋ธ ์•„ํ‚คํ…์ฒ˜๊ฐ€ ์ง€์›ํ•˜๋Š” ๊ฒƒ)์™€ ์‹ค์šฉ์  ์ปจํ…์ŠคํŠธ ๊ธธ์ด(ํ’ˆ์งˆ์ด ์•ˆ์ •์ ์œผ๋กœ ์œ ์ง€๋˜๋Š” ๋ฒ”์œ„)์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ๊ธฐ์ˆ ์ ์œผ๋กœ 128K ํ† ํฐ์„ ์ง€์›ํ•˜๋”๋ผ๋„ 100K ํ† ํฐ ์ง€์ ์— ์ œ์‹œ๋œ ์ •๋ณด์—์„œ๋Š” ํ’ˆ์งˆ์ด ์ €ํ•˜๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

2026๋…„์— 128K ํ† ํฐ ์ปจํ…์ŠคํŠธ๋ฅผ ์ง€์›ํ•˜๋Š” ๋กœ์ปฌ LLM์€?

ModelContext WindowPractical LimitOllama Command
Llama 3.3 8B128K~32K ์•ˆ์ •ollama run llama3.2
Llama 3.2 3B128K~16K ์•ˆ์ •ollama run llama3.2:3b
Llama 3.3 70B128K~64K ์•ˆ์ •ollama run llama3.3:70b
Qwen3 7B128K~32K ์•ˆ์ •ollama run qwen2.5:7b
Qwen3 72B128K~64K ์•ˆ์ •ollama run qwen2.5:72b
Mistral Small 3.1 24B128K~32K ์•ˆ์ •ollama run mistral-small3.1
Gemma 2 2B8K~6K ์•ˆ์ •ollama run gemma2:2b
Mistral Small v0.332K~16K ์•ˆ์ •ollama run llama3.2
128K ์ปจํ…์ŠคํŠธ๋ฅผ ์ง€์›ํ•˜๋Š” ๋กœ์ปฌ LLM 6๊ฐœ -- 7B ๋ชจ๋ธ์˜ ์‹ค์šฉ์  ์•ˆ์ • ํ•œ๊ณ„๋Š” 32K, 70B ๋ชจ๋ธ์€ 64K์ž…๋‹ˆ๋‹ค.
128K ์ปจํ…์ŠคํŠธ๋ฅผ ์ง€์›ํ•˜๋Š” ๋กœ์ปฌ LLM 6๊ฐœ -- 7B ๋ชจ๋ธ์˜ ์‹ค์šฉ์  ์•ˆ์ • ํ•œ๊ณ„๋Š” 32K, 70B ๋ชจ๋ธ์€ 64K์ž…๋‹ˆ๋‹ค.

๊ธด ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ์—๋Š” ์–ผ๋งˆ๋‚˜ ๋งŽ์€ RAM์ด ํ•„์š”ํ•ฉ๋‹ˆ๊นŒ?

RAM ์‚ฌ์šฉ๋Ÿ‰์€ ๋ชจ๋ธ ํฌ๊ธฐ์™€ ์ปจํ…์ŠคํŠธ ๊ธธ์ด ๋ชจ๋‘์— ๋”ฐ๋ผ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. KV ์บ์‹œ(ํ‚ค-๊ฐ’ ์บ์‹œ)๋Š” ์ฒ˜๋ฆฌ๋œ ๋ชจ๋“  ํ† ํฐ์˜ ์–ดํ…์…˜ ์ƒํƒœ๋ฅผ ์ €์žฅํ•˜๋ฉฐ, ์ด๋Š” ์ปจํ…์ŠคํŠธ ๊ธธ์ด์— ์„ ํ˜•์ ์œผ๋กœ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

2026๋…„ 4์›” ๊ธฐ์ค€, Q4_K_M์˜ 7B ๋ชจ๋ธ์€ 4K ์ปจํ…์ŠคํŠธ์—์„œ ์•ฝ 6GB RAM์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋™์ผ ๋ชจ๋ธ๋กœ 32K ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ์•ฝ 8~9GB RAM์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. 128K ์ปจํ…์ŠคํŠธ์˜ ๊ฒฝ์šฐ: ์•ฝ 12~16GB RAM.

Model4K Context32K Context128K Context
Llama 3.3 8B Q4_K_M~6 GB~9 GB~14 GB
Qwen3 14B Q4_K_M~9 GB~12 GB~18 GB
Mistral Small 3.1 24B Q4_K_M~14 GB~17 GB~24 GB
Llama 3.3 70B Q4_K_M~40 GB~45 GB~55 GB
KV ์บ์‹œ RAM์€ ์ปจํ…์ŠคํŠธ ๊ธธ์ด์— ๋”ฐ๋ผ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. Q4_K_M์˜ 7B ๋ชจ๋ธ์€ 4K ์ปจํ…์ŠคํŠธ์—์„œ ์•ฝ 6GB, 128K ์ปจํ…์ŠคํŠธ์—์„œ ์•ฝ 14GB๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
KV ์บ์‹œ RAM์€ ์ปจํ…์ŠคํŠธ ๊ธธ์ด์— ๋”ฐ๋ผ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. Q4_K_M์˜ 7B ๋ชจ๋ธ์€ 4K ์ปจํ…์ŠคํŠธ์—์„œ ์•ฝ 6GB, 128K ์ปจํ…์ŠคํŠธ์—์„œ ์•ฝ 14GB๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

์‹ค์šฉ์  ์ปจํ…์ŠคํŠธ ๊ธธ์ด๊ฐ€ ๊ด‘๊ณ ๋œ ์ตœ๋Œ€๊ฐ’๋ณด๋‹ค ์งง์€ ์ด์œ ๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

RoPE ์œ„์น˜ ์ธ์ฝ”๋”ฉ(Llama, Qwen, Mistral์—์„œ ์‚ฌ์šฉ)์œผ๋กœ ํ›ˆ๋ จ๋œ LLM์€ ๊ธฐ์ˆ ์ ์œผ๋กœ ์ตœ๋Œ€ ์ปจํ…์ŠคํŠธ ๊ธธ์ด๊นŒ์ง€ ํ† ํฐ์„ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, "์ค‘๊ฐ„ ์†Œ์‹ค" ํšจ๊ณผ๋ผ๊ณ  ์•Œ๋ ค์ง„ ํŒจํ„ด์œผ๋กœ ํ’ˆ์งˆ์ด ์ €ํ•˜๋ฉ๋‹ˆ๋‹ค.

์—ฐ๊ตฌ์— ๋”ฐ๋ฅด๋ฉด ์–ธ์–ด ๋ชจ๋ธ์€ ์ปจํ…์ŠคํŠธ ์ฐฝ์˜ ์‹œ์ž‘๊ณผ ๋ ๋ถ€๋ถ„์˜ ์ •๋ณด๋ฅผ ๊ฐ€์žฅ ์ž˜ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋งค์šฐ ๊ธด ์ปจํ…์ŠคํŠธ์˜ ์ค‘๊ฐ„์— ๋ฐฐ์น˜๋œ ์ •๋ณด๋Š” ๋œ ์•ˆ์ •์ ์œผ๋กœ ๊ฒ€์ƒ‰๋ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ ์ด๋Š” 128K ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ๊ฐ€์ง„ ๋ชจ๋ธ์ด ์ฒ˜์Œ 32K ํ† ํฐ๊ณผ ๋งˆ์ง€๋ง‰ 16K ํ† ํฐ์˜ ๋‚ด์šฉ์— ๋Œ€ํ•ด์„œ๋Š” ์•ˆ์ •์ ์œผ๋กœ ๋‹ต๋ณ€ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, 40K~80K ํ† ํฐ ๊ตฌ๊ฐ„์˜ ์„ธ๋ถ€ ์ •๋ณด๋Š” ๋†“์น  ์ˆ˜ ์žˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, ์‹ค์šฉ์  ์•ˆ์ • ํ•œ๊ณ„๋Š” ๋ชจ๋ธ ํฌ๊ธฐ์— ๋”ฐ๋ผ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค: 3B ๋ชจ๋ธ โ‰ˆ 8K~16K ์•ˆ์ •, 7B~8B ๋ชจ๋ธ โ‰ˆ 16K~32K ์•ˆ์ •, 70B ๋ชจ๋ธ โ‰ˆ 64K ์•ˆ์ •. ์ด๋Š” ๋Œ€๋žต์ ์ธ ์ˆ˜์น˜์ด๋ฉฐ ์‹ค์ œ ํ•œ๊ณ„๋Š” ํŠน์ • ์ž‘์—…๊ณผ ๊ฒ€์ƒ‰ ์ •๋ณด์˜ "์ค‘์š”๋„"์— ๋”ฐ๋ผ ๋‹ค๋ฆ…๋‹ˆ๋‹ค.

๊ธด ์ปจํ…์ŠคํŠธ ์ฐฝ์€ ๋” ๋งŽ์€ ์ž…๋ ฅ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜์ง€๋งŒ, ๋ชจ๋ธ์ด ํ•ด๋‹น ์ปจํ…์ŠคํŠธ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ•˜๋Š”์ง€๋Š” ํ”„๋กฌํ”„ํŠธ ๊ตฌ์กฐ์— ๋‹ฌ๋ ค ์žˆ์Šต๋‹ˆ๋‹ค. RAG, ํ”„๋กฌํ”„ํŠธ ์ฒด์ด๋‹, ์ปจํ…์ŠคํŠธ ์ฐฝ ๊ด€๋ฆฌ ์ „๋žต ๋“ฑ์˜ ๊ธฐ๋ฒ•์€ ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง ๊ฐ€์ด๋“œ์—์„œ ๋‹ค๋ฃจ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

"์ค‘๊ฐ„ ์†Œ์‹ค" ํšจ๊ณผ: LLM์€ ์ปจํ…์ŠคํŠธ ์ฐฝ์˜ ์‹œ์ž‘๊ณผ ๋ ๋ถ€๋ถ„์˜ ๋‚ด์šฉ์€ ์•ˆ์ •์ ์œผ๋กœ ๊ธฐ์–ตํ•˜์ง€๋งŒ 40K~80K ํ† ํฐ ๊ตฌ๊ฐ„์€ ๋†“์นฉ๋‹ˆ๋‹ค.
"์ค‘๊ฐ„ ์†Œ์‹ค" ํšจ๊ณผ: LLM์€ ์ปจํ…์ŠคํŠธ ์ฐฝ์˜ ์‹œ์ž‘๊ณผ ๋ ๋ถ€๋ถ„์˜ ๋‚ด์šฉ์€ ์•ˆ์ •์ ์œผ๋กœ ๊ธฐ์–ตํ•˜์ง€๋งŒ 40K~80K ํ† ํฐ ๊ตฌ๊ฐ„์€ ๋†“์นฉ๋‹ˆ๋‹ค.

Ollama์—์„œ ์ปจํ…์ŠคํŠธ ๊ธธ์ด๋ฅผ ์–ด๋–ป๊ฒŒ ์„ค์ •ํ•ฉ๋‹ˆ๊นŒ?

๋ณ„๋„ ์„ค์ •์ด ์—†์œผ๋ฉด Ollama๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ 2048 ํ† ํฐ์˜ ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์˜ ์ „์ฒด ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ์‚ฌ์šฉํ•˜๋ ค๋ฉด:

์ปจํ…์ŠคํŠธ ์ฐฝ ํฌ๊ธฐ๋Š” ๋ชจ๋ธ์ด ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ํ…์ŠคํŠธ ์–‘์„ ๊ฒฐ์ •ํ•˜์ง€๋งŒ, ๋ชจ๋ธ์ด ํ•ด๋‹น ์ปจํ…์ŠคํŠธ๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ํ™œ์šฉํ•˜๋Š”์ง€๋Š” ํ”„๋กฌํ”„ํŠธ ๊ตฌ์กฐ์— ๋‹ฌ๋ ค ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ์ด์ „ ์ž…๋ ฅ์„ ์žŠ๋Š” ์ด์œ ์™€ ์ด๋ฅผ ์™„ํ™”ํ•˜๋Š” ์ „๋žต์— ๋Œ€ํ•œ ์‹ฌ์ธต ์„ค๋ช…์€ ์ปจํ…์ŠคํŠธ ์ฐฝ ์„ค๋ช…: AI๊ฐ€ ์žŠ๋Š” ์ด์œ ๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

bash
# ๋Ÿฐํƒ€์ž„์—์„œ ์ปจํ…์ŠคํŠธ ๊ธธ์ด ์„ค์ •
ollama run llama3.2 --ctx 32768

# ๋˜๋Š” Modelfile๋กœ ์ปค์Šคํ…€ ๋ชจ๋ธ ์ƒ์„ฑ
cat << EOF > Modelfile
FROM llama3.1:8b
PARAMETER num_ctx 32768
EOF
ollama create llama3.1-32k -f Modelfile
ollama run llama3.1-32k
Modelfile์—์„œ num_ctx 32768์„ ์„ค์ •ํ•˜๋ฉด Ollama์—์„œ 32K ์ปจํ…์ŠคํŠธ๊ฐ€ ํ™œ์„ฑํ™”๋ฉ๋‹ˆ๋‹ค. `ollama ps`์˜ CTX ์—ด์—์„œ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
Modelfile์—์„œ num_ctx 32768์„ ์„ค์ •ํ•˜๋ฉด Ollama์—์„œ 32K ์ปจํ…์ŠคํŠธ๊ฐ€ ํ™œ์„ฑํ™”๋ฉ๋‹ˆ๋‹ค. `ollama ps`์˜ CTX ์—ด์—์„œ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ธด ์ปจํ…์ŠคํŠธ ๋กœ์ปฌ LLM: ์ง€์—ญ๋ณ„ ์ปจํ…์ŠคํŠธ

EU / GDPR + AI Act: 2025๋…„ 2์›”๋ถ€ํ„ฐ ๋ฐœํšจ๋œ EU AI Act๋Š” ๋Œ€๊ทœ๋ชจ ๊ฐœ์ธ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” AI ์‹œ์Šคํ…œ์„ ์ž ์žฌ์  ๊ณ ์œ„ํ—˜์œผ๋กœ ๋ถ„๋ฅ˜ํ•ฉ๋‹ˆ๋‹ค. ๋ฒ•๋ฅ  ๋ฌธ์„œ ๋ถ„์„, ์˜๋ฃŒ ๊ธฐ๋ก ์š”์•ฝ, HR ๋ฌธ์„œ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ๊ธด ์ปจํ…์ŠคํŠธ ๋กœ์ปฌ ์ถ”๋ก ์€ ์ด ์œ„ํ—˜ ๋“ฑ๊ธ‰์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๋ฉด GDPR ์ œ28์กฐ์— ๋”ฐ๋ฅธ ์ œ3์ž ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์ž ์œ„ํ—˜์ด ์ œ๊ฑฐ๋ฉ๋‹ˆ๋‹ค. ๋ฐ์ดํ„ฐ๊ฐ€ ์กฐ์ง ๋ฐ–์œผ๋กœ ๋‚˜๊ฐ€์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

๋ฏผ๊ฐํ•œ ๋ฌธ์„œ๋ฅผ ๋กœ์ปฌ์—์„œ ์ฒ˜๋ฆฌํ•˜๋Š” AI ์‹œ์Šคํ…œ์— ๋Œ€ํ•œ ๋…์ผ BSI ์ค€์ˆ˜๋ฅผ ์œ„ํ•œ ๊ถŒ์žฅ ๊ตฌ์„ฑ์€ 32K ์ปจํ…์ŠคํŠธ์˜ Q4_K_M 7B ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค(ํ‘œ์ค€ ์›Œํฌ์Šคํ…Œ์ด์…˜์˜ 9~10GB RAM์— ๋งž์Œ). ์ด๋Š” ์ตœ๋Œ€ 50ํŽ˜์ด์ง€ ๋ฌธ์„œ์—์„œ ์•ˆ์ •์ ์ธ ํ’ˆ์งˆ์„ ์ œ๊ณตํ•˜๋ฉด์„œ ๋ชจ๋“  ๋ฐ์ดํ„ฐ๋ฅผ ์˜จํ”„๋ ˆ๋ฏธ์Šค์— ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค. ๊ธด ์ปจํ…์ŠคํŠธ ๋ฌธ์„œ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ EU ์ค€์ˆ˜ ์„ ํƒ์œผ๋กœ๋Š” Llama 3.3 8B์™€ Mistral Small 3.1์ด ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค.

๊ฐœ์ธ ๋ฐ์ดํ„ฐ์— ๊ด€ํ•œ ํ”„๋ž‘์Šค CNIL ๊ฐ€์ด๋“œ๋ผ์ธ: ์™ธ๋ถ€ API ํ˜ธ์ถœ ์—†์ด Ollama๋ฅผ ํ†ตํ•œ ๋กœ์ปฌ ์ถ”๋ก ์€ ๊ฐœ์ธ ๋ฐ์ดํ„ฐ๊ฐ€ ์œ ํšจํ•œ ๋ฒ•์  ๊ทผ๊ฑฐ ์—†์ด ์ œ3์ž AI ์ œ๊ณต์ž์— ์˜ํ•ด ์ฒ˜๋ฆฌ๋˜์ง€ ์•Š์•„์•ผ ํ•œ๋‹ค๋Š” ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ถฉ์กฑํ•ฉ๋‹ˆ๋‹ค.

์ผ๋ณธ (METI): ์ผ๋ณธ์–ด ๋ฌธ์„œ๋Š” ํ† ํฌ๋‚˜์ด์ € ์ฐจ์ด๋กœ ์ธํ•ด ๋™๋“ฑํ•œ ์˜์–ด ๋ฌธ์„œ๋ณด๋‹ค 1.5~2๋ฐฐ ๋” ๋งŽ์€ ํ† ํฐ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. 50ํŽ˜์ด์ง€ ์ผ๋ณธ์–ด ๋ณด๊ณ ์„œ๋Š” 25K~35K ํ† ํฐ์„ ์†Œ๋น„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” Qwen3 7B์˜ ์•ˆ์ •์  ๋ฒ”์œ„(32K ์‹ค์šฉ ํ•œ๊ณ„) ๋‚ด์ด์ง€๋งŒ Ollama์—์„œ ๋ช…์‹œ์  ์ปจํ…์ŠคํŠธ ์„ค์ •์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค: PARAMETER num_ctx 32768. ์ผ๋ณธ์–ด ๋ฒ•๋ฅ  ๋ฐ ๊ธˆ์œต ๋ฌธ์„œ์˜ ๊ฒฝ์šฐ 32K ์ปจํ…์ŠคํŠธ์˜ Q4_K_M Qwen3 14B(์•ฝ 12GB RAM)๊ฐ€ ์ผ๋ณธ์–ด ๊ธด ์ปจํ…์ŠคํŠธ ์ฒ˜๋ฆฌ์—์„œ ์ตœ๊ณ ์˜ ํ’ˆ์งˆ ๋Œ€๋น„ RAM ํšจ์œจ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. Qwen3์˜ ์ผ๋ณธ์–ด ๋„ค์ดํ‹ฐ๋ธŒ ํ† ํฌ๋‚˜์ด์ €๋Š” Llama๋ณด๋‹ค ์ผ๋ณธ์–ด ํ…์ŠคํŠธ๋ฅผ 30~40% ๋” ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

์ค‘๊ตญ: ์ค‘๊ตญ์˜ ๋ฐ์ดํ„ฐ ๋ณด์•ˆ๋ฒ•(ๆ•ฐๆฎๅฎ‰ๅ…จๆณ•)์— ๋”ฐ๋ผ ํด๋ผ์šฐ๋“œ API๋ฅผ ํ†ตํ•œ ๋ฏผ๊ฐํ•œ ๋ฌธ์„œ ์ฒ˜๋ฆฌ๋Š” ์ถ”๊ฐ€์ ์ธ ๊ทœ์ œ ์ค€์ˆ˜๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. Qwen3(Alibaba)๋ฅผ ํ†ตํ•œ ๋กœ์ปฌ ๊ธด ์ปจํ…์ŠคํŠธ ์ถ”๋ก ์€ ๋ชจ๋“  ๋ฌธ์„œ ๋‚ด์šฉ์„ ์˜จํ”„๋ ˆ๋ฏธ์Šค์— ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค. ์ค‘๊ตญ ๊ธฐ์—… ๋ฌธ์„œ ์ฒ˜๋ฆฌ์˜ ๊ฒฝ์šฐ, ๋กœ์ปฌ ์›Œํฌ์Šคํ…Œ์ด์…˜์—์„œ 32K ์ปจํ…์ŠคํŠธ์˜ Qwen3 72B(์•ฝ 45GB RAM)๋Š” ์™„์ „ํ•œ ๋ฐ์ดํ„ฐ ์ฃผ๊ถŒ์„ ์œ ์ง€ํ•˜๋ฉด์„œ ํด๋ผ์šฐ๋“œ์— ์ค€ํ•˜๋Š” ํ’ˆ์งˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. Qwen3์˜ ์ค‘๊ตญ์–ด ๋„ค์ดํ‹ฐ๋ธŒ ํ† ํฌ๋‚˜์ด์ €๋Š” ์ค‘๊ตญ์–ด ๋ฌธ์„œ์—์„œ Llama๋ณด๋‹ค 30~40% ๋” ํ† ํฐ ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค.

๊ธด ์ปจํ…์ŠคํŠธ ๋กœ์ปฌ LLM ์‚ฌ์šฉ ์‹œ ํ”ํ•œ ์‹ค์ˆ˜

  • 128K ์ปจํ…์ŠคํŠธ๊ฐ€ 4K์™€ ๋™์ผํ•˜๊ฒŒ ์ž˜ ์ž‘๋™ํ•œ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๋Š” ๊ฒƒ: "์ค‘๊ฐ„ ์†Œ์‹ค" ํšจ๊ณผ๋กœ ์ธํ•ด 30K~80K ํ† ํฐ ์ด์ „์— ์ œ์‹œ๋œ ์ •๋ณด๋Š” ์‹œ์ž‘์ด๋‚˜ ๋ ๋ถ€๋ถ„์˜ ์ •๋ณด๋ณด๋‹ค ๋œ ์•ˆ์ •์ ์œผ๋กœ ๊ฒ€์ƒ‰๋ฉ๋‹ˆ๋‹ค. ์ค‘์š”ํ•œ ๋ฌธ์„œ ๋ถ„์„์˜ ๊ฒฝ์šฐ, ์ „์ฒด 100K ๋ฌธ์„œ๋ฅผ ํ•œ ๋ฒˆ์— ์ž…๋ ฅํ•˜๋Š” ๋Œ€์‹  ๊ธด ๋ฌธ์„œ๋ฅผ 16K~32K ์„น์…˜์œผ๋กœ ๋ถ„ํ• ํ•˜์—ฌ ๊ฐ๊ฐ ์ฒ˜๋ฆฌํ•˜์‹ญ์‹œ์˜ค.
  • Ollama์˜ ๊ธฐ๋ณธ ์ปจํ…์ŠคํŠธ ํฌ๊ธฐ๋ฅผ ๋Š˜๋ฆฌ์ง€ ์•Š๋Š” ๊ฒƒ: ๋ชจ๋ธ์˜ ์ตœ๋Œ€๊ฐ’๊ณผ ๊ด€๊ณ„์—†์ด Ollama๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ 2048 ํ† ํฐ์˜ ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. 2048 ํ† ํฐ์„ ์ดˆ๊ณผํ•˜๋Š” ๋Œ€ํ™”๋Š” ์ด์ „ ๋ฉ”์‹œ์ง€๋ฅผ ์ž˜๋ผ๋ƒ…๋‹ˆ๋‹ค. ํ•ญ์ƒ num_ctx๋ฅผ ๋ช…์‹œ์ ์œผ๋กœ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค: Modelfile์— PARAMETER num_ctx 32768์„ ์ถ”๊ฐ€ํ•˜๊ฑฐ๋‚˜ ๋Ÿฐํƒ€์ž„์—์„œ --ctx๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • ๋ถˆ์ถฉ๋ถ„ํ•œ RAM์œผ๋กœ ๊ธด ์ปจํ…์ŠคํŠธ ์‹คํ–‰: ์ด 8GB RAM์—์„œ 128K ์ปจํ…์ŠคํŠธ๋กœ 7B ๋ชจ๋ธ์„ ์‹คํ–‰ํ•˜๋ฉด ์‹ฌ๊ฐํ•œ ์Šค์™‘ ์‚ฌ์šฉ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ ๊ฐ€์ค‘์น˜(์•ฝ 4.5GB)์™€ 128K KV ์บ์‹œ(์•ฝ 8GB ์ด์ƒ)๋ฅผ ํ•ฉ์น˜๋ฉด 8GB๋ฅผ ์ดˆ๊ณผํ•ฉ๋‹ˆ๋‹ค. ์ปจํ…์ŠคํŠธ๋ฅผ 32K๋กœ ์ค„์ด๊ฑฐ๋‚˜(์•ฝ 9GB์— ๋งž์Œ) 128K ์ปจํ…์ŠคํŠธ ์ถ”๋ก ์„ ์œ„ํ•ด 16GB ์ด์ƒ์˜ RAM์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • ๊ธด ์ปจํ…์ŠคํŠธ์—์„œ ์ƒ์„ฑ ์†๋„๋งŒ์ด ์œ ์ผํ•œ ์ง€์—ฐ ์š”์†Œ๋ผ๋Š” ๊ฒƒ์„ ์žŠ๋Š” ๊ฒƒ: 32K ์ปจํ…์ŠคํŠธ์—์„œ ์†Œ๋น„์ž์šฉ ํ•˜๋“œ์›จ์–ด์˜ ์ฒซ ๋ฒˆ์งธ ํ† ํฐ๊นŒ์ง€์˜ ์‹œ๊ฐ„(TTFT)์€ 5~15์ดˆ๊ฐ€ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ์€ ๋‹จ ํ•˜๋‚˜์˜ ์ถœ๋ ฅ ํ† ํฐ์„ ์ƒ์„ฑํ•˜๊ธฐ ์ „์— 32K ์ž…๋ ฅ ํ† ํฐ ์ „์ฒด๋ฅผ ์ฒ˜๋ฆฌํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด ํ”„๋ฆฌํ•„ ๋‹จ๊ณ„๋Š” ์ปจํ…์ŠคํŠธ ๊ธธ์ด์— ์„ ํ˜•์ ์œผ๋กœ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ๋Œ€ํ™”ํ˜• ์‚ฌ์šฉ์—์„œ๋Š” ์ปจํ…์ŠคํŠธ๋ฅผ 8K~16K๋กœ ์ œํ•œํ•˜์‹ญ์‹œ์˜ค. 32K ์ด์ƒ์˜ ์ปจํ…์ŠคํŠธ๋Š” TTFT๊ฐ€ ํ—ˆ์šฉ ๊ฐ€๋Šฅํ•œ ๋ฐฐ์น˜ ์ฒ˜๋ฆฌ์šฉ์œผ๋กœ ์˜ˆ์•ฝํ•˜์‹ญ์‹œ์˜ค.
  • RAG๊ฐ€ ์ ํ•ฉํ•œ ๊ฒฝ์šฐ์— ๊ธด ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ๊ทธ ๋ฐ˜๋Œ€์˜ ๊ฒฝ์šฐ: RAG๋Š” ์—ฌ๋Ÿฌ ๋ฌธ์„œ์— ๊ฑธ์นœ ๋ฌธ์„œ ๊ฒ€์ƒ‰์— ๋” ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ๊ธด ์ปจํ…์ŠคํŠธ๋Š” ๊ณ„์•ฝ์„œ, ์ฝ”๋“œ๋ฒ ์ด์Šค, ์ฑ… ์ฑ•ํ„ฐ์ฒ˜๋Ÿผ ์™„์ „ํ•˜๊ณ  ์ผ๊ด€๋œ ๋ฌธ์„œ ์ „์ฒด์— ๋Œ€ํ•ด ๋ชจ๋ธ์ด ์ถ”๋ก ํ•ด์•ผ ํ•  ๋•Œ ๋” ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. 10ํŽ˜์ด์ง€ ๋ฒ•๋ฅ  ๊ณ„์•ฝ์„œ๋ฅผ RAG ์ฒญํฌ๋กœ ๋ถ„ํ• ํ•˜๋ฉด ๊ธด ์ปจํ…์ŠคํŠธ๋กœ ํ”ผํ•  ์ˆ˜ ์žˆ๋Š” ๊ต์ฐจ ์ฐธ์กฐ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ๋ณธ ์„ค์ •์ด ์•„๋‹Œ ์ž‘์—… ์œ ํ˜•์— ๋”ฐ๋ผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.

FAQ

๋กœ์ปฌ LLM์œผ๋กœ ์ฑ… ์ „์ฒด๋ฅผ ์š”์•ฝํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์ผ๋ฐ˜์ ์ธ 300ํŽ˜์ด์ง€ ์ฑ…์€ 9๋งŒ~12๋งŒ ๋‹จ์–ด๋กœ, ์•ฝ 120K~160K ํ† ํฐ์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋Œ€๋ถ€๋ถ„์˜ 7B ๋ชจ๋ธ์˜ ์‹ค์šฉ์  ์‹ ๋ขฐ ์ปจํ…์ŠคํŠธ๋ฅผ ์ดˆ๊ณผํ•˜๋ฉฐ, 70B ๋ชจ๋ธ(64K ์•ˆ์ •)์ด๋‚˜ ๋ถ„ํ•  ์ฒ˜๋ฆฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. 7B ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ ์ฑ…์„ 2๋งŒ ๋‹จ์–ด ๋‹จ์œ„์˜ ์ฑ•ํ„ฐ๋กœ ๋ถ„ํ• ํ•˜์—ฌ ๊ฐ๊ฐ ์š”์•ฝํ•œ ํ›„, ์ฑ•ํ„ฐ ์š”์•ฝ๋ณธ์„ ๋‹ค์‹œ ์š”์•ฝํ•˜์‹ญ์‹œ์˜ค.

32K ํ† ํฐ์—๋Š” ๋ช‡ ํŽ˜์ด์ง€์˜ ํ…์ŠคํŠธ๊ฐ€ ๋“ค์–ด๊ฐ‘๋‹ˆ๊นŒ?

ํ‘œ์ค€ ์˜์–ด ํ…์ŠคํŠธ ๊ธฐ์ค€(ํŽ˜์ด์ง€๋‹น 250๋‹จ์–ด) ์•ฝ 50~70ํŽ˜์ด์ง€์ž…๋‹ˆ๋‹ค. 32K ํ† ํฐ ์ปจํ…์ŠคํŠธ์—๋Š” ๋‹จํŽธ ์†Œ์„ค, ๋ถ€๋ก์ด ํฌํ•จ๋œ ์™„์ „ํ•œ ์—ฐ๊ตฌ ๋…ผ๋ฌธ, ๋˜๋Š” ์ „์ฒด ๊ธฐ์ˆ  ์‚ฌ์–‘ ๋ฌธ์„œ๊ฐ€ ๋“ค์–ด๊ฐ‘๋‹ˆ๋‹ค.

์ปจํ…์ŠคํŠธ ๊ธธ์ด๋ฅผ ๋Š˜๋ฆฌ๋ฉด ์ถ”๋ก  ์†๋„๊ฐ€ ๋А๋ ค์ง‘๋‹ˆ๊นŒ?

๊ทธ๋ ‡์Šต๋‹ˆ๋‹ค. ์–ดํ…์…˜ ๊ณ„์‚ฐ์˜ ์ด์ฐจ ํ•จ์ˆ˜์  ํ™•์žฅ์œผ๋กœ ์ธํ•ด ๋™์ผ ํ•˜๋“œ์›จ์–ด์—์„œ 32K ์ปจํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•˜๋Š” ๊ฒƒ์€ 4K ์ปจํ…์ŠคํŠธ๋ณด๋‹ค ์•ฝ 3~4๋ฐฐ ๋” ์˜ค๋ž˜ ๊ฑธ๋ฆฝ๋‹ˆ๋‹ค. ํ† ํฐ ์ƒ์„ฑ ์†๋„(์ดˆ๋‹น ํ† ํฐ)๋Š” ํฌ๊ฒŒ ์˜ํ–ฅ์„ ๋ฐ›์ง€ ์•Š์ง€๋งŒ, ์ฒซ ๋ฒˆ์งธ ํ† ํฐ๊นŒ์ง€์˜ ์‹œ๊ฐ„(TTFT)์€ ์ž…๋ ฅ ๊ธธ์ด์— ๋”ฐ๋ผ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

๊ธด ์ปจํ…์ŠคํŠธ๋ณด๋‹ค RAG๋ฅผ ๋” ์ž˜ ์ฒ˜๋ฆฌํ•˜๋Š” ๋กœ์ปฌ LLM์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

๋ฌธ์„œ ๊ฒ€์ƒ‰ ๋ฐ ๊ฒ€์ƒ‰ ์ž‘์—…์˜ ๊ฒฝ์šฐ, RAG(๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ)๋Š” ์ „์ฒด ๋ฌธ์„œ๋ฅผ ์ปจํ…์ŠคํŠธ๋กœ ์ž…๋ ฅํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ๋” ํšจ๊ณผ์ ์ธ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. RAG๋Š” ๋Œ€๊ทœ๋ชจ ๋ฌธ์„œ ์„ธํŠธ์—์„œ ๊ฐ€์žฅ ๊ด€๋ จ์„ฑ ๋†’์€ 3~5๊ฐœ ์ฒญํฌ๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋ชจ๋ธ์—๊ฒŒ๋งŒ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” 4K~8K ํ† ํฐ์˜ ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉฐ "์ค‘๊ฐ„ ์†Œ์‹ค" ๋ฌธ์ œ๋ฅผ ํ”ผํ•ฉ๋‹ˆ๋‹ค. GPT4All LocalDocs ๋ฐ LlamaIndex์™€ ๊ฐ™์€ ๋„๊ตฌ๊ฐ€ ๋กœ์ปฌ RAG๋ฅผ ๊ตฌํ˜„ํ•ฉ๋‹ˆ๋‹ค.

KV ์บ์‹œ๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์ปจํ…์ŠคํŠธ ๊ธธ์ด์— ๋”ฐ๋ผ ์™œ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๊นŒ?

KV ์บ์‹œ(ํ‚ค-๊ฐ’ ์บ์‹œ)๋Š” ์ปจํ…์ŠคํŠธ ์ฐฝ์—์„œ ์ฒ˜๋ฆฌ๋œ ๋ชจ๋“  ํ† ํฐ์— ๋Œ€ํ•œ ์–ดํ…์…˜ ์ƒํƒœ๋ฅผ ์ €์žฅํ•ฉ๋‹ˆ๋‹ค. ๊ฐ ํ† ํฐ์€ ํ‚ค ๋ฐ ๊ฐ’ ๋ฒกํ„ฐ๋ฅผ ์œ„ํ•œ ๊ณ ์ •๋œ ์–‘์˜ ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ 32K ์ปจํ…์ŠคํŠธ๋Š” 4K ์ปจํ…์ŠคํŠธ๋ณด๋‹ค 8๋ฐฐ ๋” ๋งŽ์€ KV ์บ์‹œ ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ด๊ฒƒ์ด Q4_K_M์˜ 7B ๋ชจ๋ธ์ด 4K ์ปจํ…์ŠคํŠธ์—์„œ ์•ฝ 6GB, 32K ์ปจํ…์ŠคํŠธ์—์„œ ์•ฝ 9GB๊ฐ€ ํ•„์š”ํ•œ ์ด์œ ์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ ๊ฐ€์ค‘์น˜๋Š” ๋ณ€ํ•˜์ง€ ์•Š๊ณ  KV ์บ์‹œ๋งŒ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ ๋ชจ๋ธ์ด Gemini 3.1 Pro์ฒ˜๋Ÿผ 1M ํ† ํฐ ์ปจํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์•„๋‹ˆ์š”. 2026๋…„ 4์›” ๊ธฐ์ค€, ๋กœ์ปฌ์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ ์ค‘ 1M ํ† ํฐ ์ปจํ…์ŠคํŠธ๋ฅผ ์ง€์›ํ•˜๋Š” ๊ฒƒ์€ ์—†์Šต๋‹ˆ๋‹ค. Gemini 3.1 Pro์˜ 1M ํ† ํฐ ์ฐฝ์€ Google์˜ TPU ์ธํ”„๋ผ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ์—์„œ๋Š” ํ˜„์žฌ ์†Œ๋น„์ž์šฉ ํ•˜๋“œ์›จ์–ด๊ฐ€ ์ง€์›ํ•˜๋Š” ์ตœ๋Œ€ 128K๊ฐ€ ํ•œ๊ณ„์ž…๋‹ˆ๋‹ค. 1M ์ด์ƒ์˜ ํ† ํฐ ์ปจํ…์ŠคํŠธ๊ฐ€ ํ•„์š”ํ•œ ์ž‘์—…์—์„œ๋Š” ํด๋ผ์šฐ๋“œ API๊ฐ€ ์œ ์ผํ•œ ์‹ค์šฉ์  ์˜ต์…˜์ž…๋‹ˆ๋‹ค.

"์ค‘๊ฐ„ ์†Œ์‹ค" ๋ฌธ์ œ๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์–ด๋–ป๊ฒŒ ํ”ผํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์—ฐ๊ตฌ์— ๋”ฐ๋ฅด๋ฉด LLM์€ ์ปจํ…์ŠคํŠธ ์ฐฝ์˜ ์‹œ์ž‘๊ณผ ๋ ๋ถ€๋ถ„์˜ ์ •๋ณด๋Š” ์•ˆ์ •์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•˜์ง€๋งŒ ์ค‘๊ฐ„ ๋ถ€๋ถ„์˜ ์„ธ๋ถ€ ์ •๋ณด๋Š” ๋†“์นฉ๋‹ˆ๋‹ค. 128K ์ปจํ…์ŠคํŠธ์—์„œ 40K~80K ํ† ํฐ ๊ตฌ๊ฐ„์— ๋ฐฐ์น˜๋œ ๋‚ด์šฉ์ด ๊ฐ€์žฅ ๋ฌด์‹œ๋  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ”ผํ•˜๋ ค๋ฉด: ์ค‘์š”ํ•œ ์ •๋ณด๋ฅผ ํ”„๋กฌํ”„ํŠธ ์‹œ์ž‘ ๋ถ€๋ถ„์— ๋ฐฐ์น˜ํ•˜๊ณ , RAG๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ด€๋ จ ์ฒญํฌ๋งŒ ๊ฒ€์ƒ‰ํ•˜๊ฑฐ๋‚˜, ๊ธด ๋ฌธ์„œ๋ฅผ ๊ฒน์น˜๋Š” 16K~32K ์„น์…˜์œผ๋กœ ๋ถ„ํ•  ์ฒ˜๋ฆฌํ•˜์‹ญ์‹œ์˜ค.

Ollama๊ฐ€ ์‚ฌ์šฉ ์ค‘์ธ ์ปจํ…์ŠคํŠธ ๊ธธ์ด๋ฅผ ์–ด๋–ป๊ฒŒ ํ™•์ธํ•ฉ๋‹ˆ๊นŒ?

`ollama show <๋ชจ๋ธ๋ช…>`์„ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. ์ถœ๋ ฅ์—๋Š” num_ctx๋ฅผ ํฌํ•จํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ๋ชฉ๋ก์ด ํ‘œ์‹œ๋ฉ๋‹ˆ๋‹ค. 2048๋กœ ํ‘œ์‹œ๋˜๋ฉด Ollama๊ฐ€ ๊ธฐ๋ณธ๊ฐ’์„ ์‚ฌ์šฉ ์ค‘์ด๋ฉฐ ๋ชจ๋ธ์˜ ์ „์ฒด ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ์‚ฌ์šฉํ•˜์ง€ ์•Š๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์˜๊ตฌ์ ์œผ๋กœ ๋ณ€๊ฒฝํ•˜๋ ค๋ฉด PARAMETER num_ctx 32768์ด ํฌํ•จ๋œ Modelfile์„ ์ƒ์„ฑํ•˜๊ณ  ollama create <์ด๋ฆ„> -f Modelfile์„ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. ollama ps๋กœ ํ™œ์„ฑ ์„ธ์…˜์„ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

๋ฌธ์„œ ์งˆ์˜์‘๋‹ต์—๋Š” ๊ธด ์ปจํ…์ŠคํŠธ์™€ RAG ์ค‘ ์–ด๋А ๊ฒƒ์ด ๋” ๋‚ซ์Šต๋‹ˆ๊นŒ?

RAG๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ๋ฌธ์„œ Q&A์—์„œ ๊ธด ์ปจํ…์ŠคํŠธ๋ณด๋‹ค ๋” ํšจ๊ณผ์ ์ด๊ณ  RAM ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค. RAG๋Š” ๋Œ€๊ทœ๋ชจ ์ฝ”ํผ์Šค์—์„œ ๊ด€๋ จ์„ฑ ๋†’์€ 3~5๊ฐœ ์ฒญํฌ(์ด 4K~8K ํ† ํฐ)๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ "์ค‘๊ฐ„ ์†Œ์‹ค" ๋ฌธ์ œ๋ฅผ ํ”ผํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ์ „์ฒด ๋ฌธ์„œ ๊ตฌ์กฐ๋ฅผ ์ดํ•ดํ•˜๊ฑฐ๋‚˜ ์„น์…˜ ๊ฐ„์˜ ์ •ํ™•ํ•œ ์ˆœ์„œ์™€ ๊ด€๊ณ„๊ฐ€ ์ค‘์š”ํ•œ ๊ฒฝ์šฐ์—๋Š” ๊ธด ์ปจํ…์ŠคํŠธ๊ฐ€ ๋” ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ์‹ค์šฉ์ ์ธ ๋ฌธ์„œ Q&A์—์„œ๋Š” RAG๋กœ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค.

128K ์ด์ƒ ์ปจํ…์ŠคํŠธ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•  ํ•˜๋“œ์›จ์–ด๊ฐ€ ํ•„์š”ํ•˜์‹ญ๋‹ˆ๊นŒ? ํ•˜๋“œ์›จ์–ด ๊ฐ€์ด๋“œ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค.

๋กœ์ปฌ LLM ํ•˜๋“œ์›จ์–ด ๊ฐ€์ด๋“œ 2026 โ†’

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Run PromptQuorum with a local LLM, your own API keys, or both โ€” you pick the backend.

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

๋กœ์ปฌ LLM ๊ธด ์ปจํ…์ŠคํŠธ 2026: Ollama์—์„œ 64K~1M ํ† ํฐ | PromptQuorum