Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/2026๋…„ ์ตœ๊ณ ์˜ ์ฝ”๋”ฉ LLM: Qwen vs DeepSeek vs Llama ์„ฑ๋Šฅ ๋น„๊ต
์ตœ๊ณ ์˜ ๋ชจ๋ธ

2026๋…„ ์ตœ๊ณ ์˜ ์ฝ”๋”ฉ LLM: Qwen vs DeepSeek vs Llama ์„ฑ๋Šฅ ๋น„๊ต

ยท9๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

2026๋…„ 6์›” ๊ธฐ์ค€ ์ตœ๊ณ ์˜ ๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ์€ ์ตœ๋Œ€ ํ’ˆ์งˆ์„ ์œ„ํ•œ Kimi K2.6(SWE-Bench Pro 58.6์ , MoE ์•„ํ‚คํ…์ฒ˜, Modified MIT ๋ผ์ด์„ ์Šค), ๊ท ํ˜• ์žกํžŒ ์„ฑ๋Šฅ์„ ์œ„ํ•œ Qwen 3.6 27B(SWE-bench 77.2%, ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ), ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์œ„ํ•œ Devstral Small 24B์ž…๋‹ˆ๋‹ค. 8GB RAM ํ™˜๊ฒฝ์—์„œ๋Š” Qwen3 8B๊ฐ€ ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค. ๋ชจ๋“  ๋ชจ๋ธ์€ Ollama๋ฅผ ํ†ตํ•ด ๋กœ์ปฌ์—์„œ ์‹คํ–‰๋˜๋ฏ€๋กœ ํด๋ผ์šฐ๋“œ API ๋น„์šฉ ์—†์ด ์˜คํ”„๋ผ์ธ์œผ๋กœ ๋น„๊ณต๊ฐœ ์ฝ”๋“œ ์ƒ์„ฑ์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ผ ํ•จ์ˆ˜๋งŒ ํ…Œ์ŠคํŠธํ•˜๋Š” HumanEval๊ณผ ๋‹ฌ๋ฆฌ, SWE-bench(์‹ค์ œ GitHub ์ด์Šˆ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ ํ‰๊ฐ€)๋Š” 2026๋…„ ์‹ค๋ฌด ์ฝ”๋”ฉ์˜ ์ฃผ์š” ๋ฒค์น˜๋งˆํฌ๋กœ ์ž๋ฆฌ ์žก์•˜์Šต๋‹ˆ๋‹ค.

2026๋…„ 6์›” ๊ธฐ์ค€ ์ฝ”๋”ฉ์— ์ตœ์ ํ™”๋œ ๋กœ์ปฌ LLM์€ Kimi K2.6(SWE-Bench Pro 58.6์ , MoE ์•„ํ‚คํ…์ฒ˜, Modified MIT ๋ผ์ด์„ ์Šค), Qwen 3.6 27B(SWE-bench 77.2%, ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ), Devstral Small 24B(์—์ด์ „ํŠธ ์ฝ”๋”ฉ์— ์ตœ์ )์ž…๋‹ˆ๋‹ค. 8GB ๋ฉ”๋ชจ๋ฆฌ ํ™˜๊ฒฝ์—์„œ๋Š” Qwen3 8B๊ฐ€ ๊ถŒ์žฅ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ๋ชจ๋“  ๋ชจ๋ธ์€ Ollama๋ฅผ ํ†ตํ•ด ๋กœ์ปฌ์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.

Key Takeaways

  • ์ „์ฒด ์ตœ๊ณ  ์ฝ”๋”ฉ ๋ชจ๋ธ: Kimi K2.6 โ€” SWE-Bench Pro 58.6์ , MoE ์•„ํ‚คํ…์ฒ˜ (32B ํ™œ์„ฑ / 1T ์ „์ฒด), Modified MIT ๋ผ์ด์„ ์Šค. ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ: Qwen 3.6 27B โ€” SWE-bench 77.2%.
  • 8 GB RAM ์ตœ์ : Qwen3 8B โ€” Qwen3 8B์—์„œ ๊ฐœ์„ , VRAM 5 GB ์‚ฌ์šฉ.
  • ์—์ด์ „ํŠธ ์ฝ”๋”ฉ ์ตœ์  (๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘, ๋””๋ฒ„๊น…): Devstral Small 24B โ€” ํˆด ์ฝœ๋ง ๋ฐ ๋‹ค๋‹จ๊ณ„ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ์„ค๊ณ„๋จ.
  • IDE ์ž๋™ ์™„์„ฑ ์ตœ์ : Codestral 22B (Mistral AI) โ€” FIM ์ตœ์ ํ™”, ๊ถŒ์žฅ ๋ชจ๋ธ๋กœ Starcoder2 ๋Œ€์ฒด.
  • SWE-bench๊ฐ€ 2026๋…„ 1์ฐจ ๋ฒค์น˜๋งˆํฌ๋กœ HumanEval ๋Œ€์ฒด โ€” ๋‹จ์ˆœํ•œ ๋‹จ์ผ ํ•จ์ˆ˜ Python ์ƒ์„ฑ์ด ์•„๋‹Œ ์‹ค์ œ GitHub ์ด์Šˆ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
  • AI ์ฝ”๋”ฉ ์–ด์‹œ์Šคํ„ดํŠธ ์›Œํฌํ”Œ๋กœ์šฐ(VS Code, Cursor)์— ๋Œ€ํ•ด์„œ๋Š” ์ฝ”๋”ฉ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์œ„ํ•œ ๋กœ์ปฌ LLM์„ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

๋น ๋ฅธ ์‚ฌ์‹ค โ€” ๋กœ์ปฌ ์ฝ”๋”ฉ LLM ํ•œ๋ˆˆ์— ๋ณด๊ธฐ (2026๋…„ 6์›”)

  • ์ „์ฒด ์ตœ๊ณ  (์ตœ๋Œ€ ํ’ˆ์งˆ): Kimi K2.6 โ€” SWE-Bench Pro 58.6์ , MoE (32B ํ™œ์„ฑ), Modified MIT ๋ผ์ด์„ ์Šค. ์ผ๋ฐ˜ ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—์„œ ์‚ฌ์šฉํ•˜๋ ค๋ฉด ์–‘์žํ™” ํ•„์š”.
  • ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ: Qwen 3.6 27B โ€” SWE-bench 77.2%, 22 GB VRAM, MoE ์˜ค๋ฒ„ํ—ค๋“œ ์—†์Œ.
  • ์—์ด์ „ํŠธ ์ฝ”๋”ฉ ์ตœ์ : Devstral Small 24B โ€” ๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘, ๋””๋ฒ„๊น… ์›Œํฌํ”Œ๋กœ์šฐ, 16 GB RAM, Mistral AI (ํ”„๋ž‘์Šค).
  • IDE ์ž๋™ ์™„์„ฑ ์ตœ์ : Codestral 22B (Mistral) โ€” FIM ์ตœ์ ํ™”, Continue.dev ํ†ตํ•ฉ, ์•ฝ 14 GB RAM.
  • 8 GB RAM ์ตœ์ : Qwen3 8B โ€” Qwen3 8B์—์„œ ๊ฐœ์„ , VRAM 5 GB ์‚ฌ์šฉ, ์ตœ๊ณ ์˜ ํ’ˆ์งˆ-์†๋„ ๊ท ํ˜•.
  • ๋ฒค์น˜๋งˆํฌ ๋ณ€ํ™”: SWE-bench(์‹ค์ œ GitHub ์ด์Šˆ)๊ฐ€ ์‹ค์šฉ์  ์ฝ”๋”ฉ์˜ 1์ฐจ ์ง€ํ‘œ๋กœ ์ž๋ฆฌ ์žก์•˜์Šต๋‹ˆ๋‹ค. HumanEval(๋‹จ์ผ Python ํ•จ์ˆ˜)์€ ์—ฌ์ „ํžˆ ๋น„๊ต์— ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.
  • ๊ถŒ์žฅ ์‚ฌ์–‘: 16 GB RAM ์ด์ƒ (Qwen 3.6 27B ๋˜๋Š” Devstral Small ์‹คํ–‰ ๊ฐ€๋Šฅ).
  • ๊ณ ์„ฑ๋Šฅ ์‚ฌ์–‘: 20 GB ์ด์ƒ (์–‘์žํ™”๋œ Kimi K2.6 ๋˜๋Š” ์ตœ๊ณ  ํ’ˆ์งˆ์„ ์œ„ํ•œ Qwen3-Coder 32B ์‹คํ–‰ ๊ฐ€๋Šฅ).

๐Ÿ† ์ฝ”๋”ฉ์šฉ ์ตœ๊ณ  ๋กœ์ปฌ LLM (2026๋…„ 6์›” ๋น ๋ฅธ ์„ ํƒ)

  • ์ „์ฒด ์ตœ๊ณ : Kimi K2.6 (์–‘์žํ™”) โ€” SWE-Bench Pro 58.6์ , MoE ์•„ํ‚คํ…์ฒ˜, Modified MIT ๋ผ์ด์„ ์Šค. `ollama run kimi-k2.6`
  • ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ: Qwen 3.6 27B โ€” SWE-bench 77.2%, ์ตœ๊ณ ์˜ ๋น„MoE ์˜ต์…˜. `ollama run qwen3.6:27b`
  • ์—์ด์ „ํŠธ ์ฝ”๋”ฉ ์ตœ์ : Devstral Small 24B โ€” ๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘, ๋””๋ฒ„๊น…, 16 GB RAM. `ollama run devstral-small:24b`
  • IDE ์ž๋™ ์™„์„ฑ ์ตœ์ : Codestral 22B โ€” Continue.dev์— ์ตœ์ ํ™”๋œ FIM. `ollama run codestral:22b`
  • 8 GB RAM ์ตœ์ : Qwen3 8B โ€” ํ–ฅ์ƒ๋œ ์ฝ”๋”ฉ ์„ฑ๋Šฅ, VRAM 5 GB. `ollama run qwen3:8b`
  • ๐Ÿ‘‰ ๋ชจ๋ฅด๊ฒ ๋‹ค๋ฉด: Qwen3 8B๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค โ€” ์ผ๋ฐ˜ ์†Œ๋น„์ž์šฉ ๋…ธํŠธ๋ถ(8โ€“16 GB)์—์„œ ์ตœ๊ณ ์˜ ํ’ˆ์งˆ-์†๋„ ๊ท ํ˜•.
  • ๐Ÿ‘‰ 16 GB ์ด์ƒ์˜ ๊ฒฝ์šฐ: SWE-bench ์„ฑ๋Šฅ์„ ์œ„ํ•ด Qwen 3.6 27B๋กœ ์—…๊ทธ๋ ˆ์ด๋“œํ•˜์‹ญ์‹œ์˜ค.
  • ๐Ÿ‘‰ IDE ์ž๋™ ์™„์„ฑ์ด ํ•„์š”ํ•œ ๊ฒฝ์šฐ: Continue.dev์™€ ํ•จ๊ป˜ Codestral 22B๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • ๐Ÿ‘‰ ์ตœ๋Œ€ ํ’ˆ์งˆ (20 GB ์ด์ƒ): ์˜คํ”„๋ผ์ธ ๊ธฐ๋Šฅ์„ ์œ„ํ•ด ์–‘์žํ™”๋œ Kimi K2.6 ๋˜๋Š” Qwen3-Coder 32B๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๐Ÿ› ๏ธPractice: ๋จผ์ € ํ•˜๋“œ์›จ์–ด์— ๋งž๋Š” ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. 8 GB์˜ ๊ฒฝ์šฐ Qwen3 8B๋ฅผ, 16 GB ์ด์ƒ์˜ ๊ฒฝ์šฐ Qwen 3.6 27B ๋˜๋Š” Devstral Small 24B๋ฅผ, 20 GB ์ด์ƒ์˜ ๊ฒฝ์šฐ ์ตœ๊ณ ์˜ ์‹ค์ œ ์„ฑ๋Šฅ์„ ์œ„ํ•ด Kimi K2.6 (์–‘์žํ™”)์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ๋ฉ”๋ชจ๋ฆฌ ๋ถ€์กฑ์œผ๋กœ ์‹คํ–‰์ด ๋ถˆ๊ฐ€๋Šฅํ•œ ๋Œ€ํ˜• ๋ชจ๋ธ์„ ๋‚ด๋ ค๋ฐ›๋Š” ๋ฐ ์‹œ๊ฐ„์„ ๋‚ญ๋น„ํ•˜์ง€ ๋งˆ์‹ญ์‹œ์˜ค.

ํ•œ ๋ฌธ์žฅ์œผ๋กœ

2026๋…„ 6์›” ๊ธฐ์ค€ ์ตœ๊ณ ์˜ ๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ์€ ์ตœ๋Œ€ ํ’ˆ์งˆ์„ ์œ„ํ•œ Kimi K2.6(SWE-Bench Pro 58.6์ , MoE), ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ์ธ Qwen 3.6 27B(SWE-bench 77.2%), ๊ทธ๋ฆฌ๊ณ  8 GB RAM ํ™˜๊ฒฝ์„ ์œ„ํ•œ Qwen3 8B์ž…๋‹ˆ๋‹ค.

์‰ฌ์šด ๋ง๋กœ

์ฝ”๋”ฉ ๋ชจ๋ธ์„ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•œ๋‹ค๋Š” ๊ฒƒ์€ ๋…ธํŠธ๋ถ์— AI ์ฝ”๋”ฉ ์–ด์‹œ์Šคํ„ดํŠธ๋ฅผ ์„ค์น˜ํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ฝ”๋“œ๊ฐ€ ๋น„๊ณต๊ฐœ๋กœ ์œ ์ง€๋˜๊ณ  ์˜คํ”„๋ผ์ธ์—์„œ๋„ ์ž‘๋™ํ•˜์ง€๋งŒ, GitHub Copilot๊ณผ ๊ฐ™์€ ํด๋ผ์šฐ๋“œ API๋ณด๋‹ค ๋А๋ฆฝ๋‹ˆ๋‹ค.

์ฝ”๋”ฉ์— ์ข‹์€ ๋กœ์ปฌ LLM์˜ ์กฐ๊ฑด์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

2026๋…„์—๋Š” SWE-bench๊ฐ€ ์‹ค์šฉ์  ์ฝ”๋”ฉ์˜ 1์ฐจ ๋ฒค์น˜๋งˆํฌ๋กœ HumanEval์„ ๋Œ€๋ถ€๋ถ„ ๋Œ€์ฒดํ–ˆ์Šต๋‹ˆ๋‹ค. SWE-bench๋Š” ๋‹จ์ˆœํ•œ ํ•จ์ˆ˜ ์ƒ์„ฑ์ด ์•„๋‹ˆ๋ผ ์‹ค์ œ GitHub ์ด์Šˆ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ, ์ฆ‰ ๋ฉ€ํ‹ฐํŒŒ์ผ ๋ณ€๊ฒฝ, ์ฝ”๋“œ๋ฒ ์ด์Šค ์ดํ•ด, ํ…Œ์ŠคํŠธ ์ž‘์„ฑ์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. Qwen 3.6 27B๋Š” SWE-bench์—์„œ 77.2%๋ฅผ, Kimi K2.6๋Š” SWE-Bench Pro์—์„œ 58.6์ ์„ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค.

์ฝ”๋“œ ํŠนํ™” ๋ชจ๋ธ์€ ๋Œ€๊ทœ๋ชจ ์ฝ”๋“œ ๋ฐ์ดํ„ฐ(GitHub, Stack Overflow, ๋ฌธ์„œ)๋กœ ๋ฏธ์„ธ ์กฐ์ •๋˜๋ฉฐ, ์ข…์ข… FIM(fill-in-the-middle) ํ›ˆ๋ จ์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. FIM์€ ์ปค์„œ ์•ž๋’ค์˜ ๋งฅ๋ฝ์„ ๋ชจ๋‘ ํ™œ์šฉํ•ด ์ฝ”๋“œ๋ฅผ ์™„์„ฑํ•˜๋Š” ๊ธฐ๋Šฅ์œผ๋กœ IDE ์ž๋™ ์™„์„ฑ์— ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค.

Llama 3.3 8B์™€ ๊ฐ™์€ ๋ฒ”์šฉ ๋ชจ๋ธ์€ HumanEval์—์„œ 72%๋ฅผ ๊ธฐ๋กํ•ด ๊ฒฝ์Ÿ๋ ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ๋™์ผํ•œ ํฌ๊ธฐ์˜ ์ฝ”๋“œ ์ „์šฉ ๋ชจ๋ธ์€ ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์™€ ๋ฏธ์„ธ ์กฐ์ •์ด ์ฝ”๋“œ ์ƒ์„ฑ ์ •ํ™•๋„์— ์ง‘์ค‘๋˜์–ด ์žˆ์–ด 5โ€“15% ๋” ๋†’์€ ์ ์ˆ˜๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ“ŒNote: SWE-bench๋Š” 2026๋…„ ์‹ค์ œ ์ฝ”๋”ฉ์—์„œ ๊ฐ€์žฅ ๊ด€๋ จ์„ฑ ๋†’์€ ๋ฒค์น˜๋งˆํฌ์ž…๋‹ˆ๋‹ค. HumanEval์€ ๋‹จ์ผ ํ•จ์ˆ˜ ์ƒ์„ฑ ๋น„๊ต์—๋Š” ์—ฌ์ „ํžˆ ์œ ์šฉํ•˜์ง€๋งŒ, SWE-bench๊ฐ€ ๊ฐœ๋ฐœ ์›Œํฌํ”Œ๋กœ์šฐ ์„ฑ๋Šฅ์„ ๋” ์ž˜ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค.

#1 Kimi K2.6 โ€” ์ „์ฒด ์ตœ๊ณ  ๋กœ์ปฌ ์ฝ”๋”ฉ LLM

Kimi K2.6 (Moonshot AI)๋Š” 2026๋…„ 6์›” ๊ธฐ์ค€ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ์ตœ๊ณ  ์„ฑ๋Šฅ์˜ ์ฝ”๋”ฉ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. SWE-Bench Pro์—์„œ 58.6์ ์„ ๊ธฐ๋กํ•˜๋ฉฐ Tier A์— ์ฒ˜์Œ ์ง„์ž…ํ•œ ๋น„์„œ๊ตฌ๊ถŒ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด 1T ํŒŒ๋ผ๋ฏธํ„ฐ ์ค‘ 32B๊ฐ€ ํ™œ์„ฑํ™”๋˜๋Š” MoE ์•„ํ‚คํ…์ฒ˜๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. Modified MIT ๋ผ์ด์„ ์Šค๋กœ ์ƒ์—…์  ์ด์šฉ์ด ํ—ˆ์šฉ๋ฉ๋‹ˆ๋‹ค.

`ollama run kimi-k2.6`์œผ๋กœ ์‹คํ–‰ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜ ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—์„œ๋Š” ์–‘์žํ™”๊ฐ€ ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค. ๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘, ์„ธ์…˜ ๊ธฐ๋ฐ˜ ๋ฉ€ํ‹ฐํ„ด ์ฝ”๋”ฉ, API ์‚ฌ์šฉ ์ •ํ™•๋„์—์„œ ๊ฐ•์ ์„ ๋ณด์ž…๋‹ˆ๋‹ค. ๋ณต์žกํ•œ ๋ฆฌํŒฉํ† ๋ง ๋ฐ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์„ค๊ณ„ ์ž‘์—…์—์„œ ์ตœ์ฒจ๋‹จ ํด๋ผ์šฐ๋“œ ๋ชจ๋ธ์— ํ•„์ ํ•˜๋Š” ํ’ˆ์งˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

SpecValue
SWE-Bench Pro ์ ์ˆ˜58.6 (GPT-5.5์™€ ๋™๋“ฑ)
์•„ํ‚คํ…์ฒ˜MoE (32B ํ™œ์„ฑ / 1T ์ „์ฒด)
๋ผ์ด์„ ์ŠคModified MIT (์ƒ์—…์  ์ด์šฉ ํ—ˆ์šฉ)
์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ128K ํ† ํฐ
์–‘์žํ™”์ผ๋ฐ˜ ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์— ๊ถŒ์žฅ
Ollama ๋ช…๋ น์–ดollama run kimi-k2.6

๐Ÿ”Insight: Kimi K2.6์€ MoE ์•„ํ‚คํ…์ฒ˜๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ํ† ํฐ๋‹น ํ™œ์„ฑํ™”๋˜๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ๋Š” 1T๊ฐ€ ์•„๋‹Œ 32B์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ด ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ์‹œ์‚ฌํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ๋น ๋ฅด๊ณ  ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค. MoE ๋ชจ๋ธ์€ ๋ฐ€์ง‘ํ˜• 70B ๋ชจ๋ธ์ด ํ•„์š”๋กœ ํ•˜๋Š” ํ•˜๋“œ์›จ์–ด์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.

#2 Qwen 3.6 27B โ€” ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ์ฝ”๋”ฉ ๋ชจ๋ธ

Qwen 3.6 27B๋Š” SWE-bench 77.2%๋ฅผ ๊ธฐ๋กํ•œ ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜•(๋น„MoE) ์ฝ”๋”ฉ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. MoE ๋ชจ๋ธ๊ณผ ๋‹ฌ๋ฆฌ ๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ํ† ํฐ๋‹น ํ™œ์„ฑํ™”๋˜๋ฏ€๋กœ ๋™์ž‘์ด ๋” ์˜ˆ์ธก ๊ฐ€๋Šฅํ•˜๊ณ  ์žฅ๋ฌธ ๋งฅ๋ฝ ์ถ”๋ก ์— ์œ ๋ฆฌํ•ฉ๋‹ˆ๋‹ค. 22 GB VRAM์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

`ollama run qwen3.6:27b`๋กœ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋“œ ์ƒ์„ฑ, ๋””๋ฒ„๊น…, ๊ตฌ์กฐํ™”๋œ ์ถœ๋ ฅ์— ๊ฐ•ํ•ฉ๋‹ˆ๋‹ค. ๋ฉ€ํ‹ฐํŒŒ์ผ ์ฝ”๋“œ ๋ถ„์„ ๋ฐ ๋ฆฌํŒฉํ† ๋ง์— ํƒ์›”ํ•ฉ๋‹ˆ๋‹ค. 27B ํŒŒ๋ผ๋ฏธํ„ฐ ์ „์ฒด๊ฐ€ ํ† ํฐ๋‹น ํ™œ์„ฑํ™”๋˜์–ด ๋ณต์žกํ•œ ์ฝ”๋“œ๋ฒ ์ด์Šค ์ „๋ฐ˜์— ๊ฑธ์ณ ์ผ๊ด€๋œ ์ถ”๋ก ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

SpecValue
SWE-bench ์ ์ˆ˜77.2%
์•„ํ‚คํ…์ฒ˜๋ฐ€์ง‘ํ˜• (27B ์ „์ฒด ํ™œ์„ฑ)
ํ•„์š” RAM (Q4_K_M)~22 GB
์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ128K ํ† ํฐ
์ ํ•ฉํ•œ ์šฉ๋„๋ฉ€ํ‹ฐํŒŒ์ผ ์ถ”๋ก , ๋ฆฌํŒฉํ† ๋ง
Ollama ๋ช…๋ น์–ดollama run qwen3.6:27b

๐Ÿ’กTip: ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ(๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ ํ™œ์„ฑ)๊ณผ MoE ๋ชจ๋ธ(ํฌ์†Œ ํ™œ์„ฑํ™”) ๋น„๊ต: ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ์€ ๊ธด ์ถ”๋ก  ์ฒด์ธ์—์„œ ๋” ์˜ˆ์ธก ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. MoE๋Š” ๋” ๋น ๋ฅด์ง€๋งŒ ํ† ํฐ ๋ผ์šฐํŒ… ๋ฐฉ์‹์ด ๋‹ค๋ฅผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฉ€ํ‹ฐํŒŒ์ผ ๋ถ„์„๊ณผ ์ฝ”๋“œ๋ฒ ์ด์Šค ์ดํ•ด์—๋Š” ๋ฐ€์ง‘ํ˜•์ธ Qwen 3.6 27B๊ฐ€ ํƒ์›”ํ•ฉ๋‹ˆ๋‹ค.

#3 Devstral Small 24B โ€” ์—์ด์ „ํŠธ ์ฝ”๋”ฉ์— ์ตœ์ 

Devstral Small 24B (Mistral AI)๋Š” ์—์ด์ „ํŠธ ์ฝ”๋”ฉ ์›Œํฌํ”Œ๋กœ์šฐ, ์ฆ‰ ๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘, ํˆด ์ฝœ๋ง์„ ํ†ตํ•œ ์ฝ”๋“œ ์ƒ์„ฑ, ๋””๋ฒ„๊น… ๋ฃจํ”„๋ฅผ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ์„ค๊ณ„๋œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. 16 GB RAM์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. `ollama run devstral-small:24b`๋กœ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค.

aider, Claude Code ์Šคํƒ€์ผ ์›Œํฌํ”Œ๋กœ์šฐ, ๋‹ค๋‹จ๊ณ„ ์ฝ”๋“œ ์ˆ˜์ •์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฐœ๋ฐœ์ž์—๊ฒŒ ์ตœ์ ์ž…๋‹ˆ๋‹ค. ํŒŒ์ผ ์ „๋ฐ˜์˜ ์ฝ”๋“œ ๋ณ€๊ฒฝ์„ ์ดํ•ดํ•˜๊ณ  ์˜ค๋ฅ˜ ํ”ผ๋“œ๋ฐฑ์— ๊ธฐ๋ฐ˜ํ•œ ์ˆ˜์ •์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ํƒ์›”ํ•ฉ๋‹ˆ๋‹ค. IDE ํ†ตํ•ฉ์„ ์œ„ํ•œ ํˆด ์ฝœ๋ง์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

SpecValue
์ ํ•ฉํ•œ ์šฉ๋„์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ, ๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘
ํ•„์š” RAM (Q4_K_M)~16 GB
์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ128K ํ† ํฐ
ํˆด ์ฝœ๋ง์ง€์›
๋ผ์ด์„ ์ŠคMistral Apache 2.0
Ollama ๋ช…๋ น์–ดollama run devstral-small:24b

๐Ÿ”Insight: ์—์ด์ „ํŠธ ์ฝ”๋”ฉ = ์ถ”๋ก  โ†’ ์ฝ”๋“œ ์ž‘์„ฑ โ†’ ์‹คํ–‰ โ†’ ์˜ค๋ฅ˜ ๊ด€์ฐฐ โ†’ ์ˆ˜์ • โ†’ ๋ฐ˜๋ณต. Devstral Small 24B๋Š” ์ด ๋ฃจํ”„์— ๋›ฐ์–ด๋‚ฉ๋‹ˆ๋‹ค. ์œ ์‚ฌํ•œ ํฌ๊ธฐ์˜ ๋ฒ”์šฉ ๋ชจ๋ธ๋ณด๋‹ค ๋ฉ€ํ‹ฐํŒŒ์ผ ๋งฅ๋ฝ๊ณผ ์˜ค๋ฅ˜ ์ˆ˜์ • ํ”ผ๋“œ๋ฐฑ์„ ๋” ์ž˜ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

#4 Codestral 22B โ€” IDE ์ž๋™ ์™„์„ฑ์— ์ตœ์ 

Codestral 22B (Mistral AI)๋Š” ๊ถŒ์žฅ FIM ๋ชจ๋ธ๋กœ Starcoder2๋ฅผ ๋Œ€์ฒดํ•ฉ๋‹ˆ๋‹ค. VS Code ๋ฐ Cursor์˜ Continue.dev์—์„œ FIM(fill-in-the-middle) ์ž๋™ ์™„์„ฑ์„ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ์ž๋™ ์™„์„ฑ ์ž‘์—…์—์„œ Copilot์— ๋ฒ„๊ธˆ๊ฐ€๋Š” ํ’ˆ์งˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

`ollama run codestral:22b`๋กœ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ปค์„œ ์œ„์น˜ ์•ž๋’ค์˜ ๋งฅ๋ฝ์„ ํ™œ์šฉํ•˜๋Š” IDE ์Šคํƒ€์ผ ์ฝ”๋“œ ์™„์„ฑ์— ์ตœ์ ํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. Python, JavaScript, TypeScript, Go, Rust์— ๊ฐ•ํ•ฉ๋‹ˆ๋‹ค.

์ €์žฅ์†Œ ์ธ์‹ ์ฝ”๋“œ ์™„์„ฑ์—๋Š” `ollama run qwen3-coder:30b`๊ฐ€ ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ์˜คํ”ˆ ์›จ์ดํŠธ ๋Œ€์•ˆ์ž…๋‹ˆ๋‹ค (Apache 2.0). 16 GB ํ™˜๊ฒฝ์—์„œ ์ถ”๋ก  ๊ธฐ๋Šฅ์„ ๊ฐ–์ถ˜ ์†Œํ˜• ์ฝ”๋”๊ฐ€ ํ•„์š”ํ•˜๋‹ค๋ฉด `ollama run gpt-oss:20b` (OpenAI ์˜คํ”ˆ ์›จ์ดํŠธ, ์ „์ฒด 21B / ํ™œ์„ฑ 3.6B MoE, ์กฐ์ • ๊ฐ€๋Šฅํ•œ ์ถ”๋ก )๋„ ํ›Œ๋ฅญํ•œ ์„ ํƒ์ž…๋‹ˆ๋‹ค.

SpecValue
์ ํ•ฉํ•œ ์šฉ๋„FIM (IDE ์ž๋™ ์™„์„ฑ)
ํ•„์š” RAM (Q4_K_M)~14 GB
FIM ์ง€์›์ง€์› (์ฃผ์š” ์‚ฌ์šฉ ์‚ฌ๋ก€)
๋ผ์ด์„ ์ŠคMistral Apache 2.0
IDE ํ†ตํ•ฉContinue.dev, Cursor
Ollama ๋ช…๋ น์–ดollama run codestral:22b

๐Ÿ”Insight: Mistral AI์˜ Codestral 22B๋Š” FIM(fill-in-the-middle) ์ฝ”๋“œ ์™„์„ฑ์˜ ์ƒˆ๋กœ์šด ํ‘œ์ค€์ž…๋‹ˆ๋‹ค. ์ž๋™ ์™„์„ฑ ์ •ํ™•๋„์™€ IDE ํ†ตํ•ฉ์—์„œ Starcoder2๋ฅผ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. Continue.dev์™€ ๊ฒฐํ•ฉํ•˜๋ฉด GitHub Copilot์˜ ๋กœ์ปฌ ๋Œ€์•ˆ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

#5 Qwen3 8B โ€” 8 GB RAM ํ™˜๊ฒฝ ์ตœ๊ณ ์˜ ์ฝ”๋”ฉ ๋ชจ๋ธ

Qwen3 8B๋Š” 8 GB ํ™˜๊ฒฝ์˜ ๊ถŒ์žฅ ๋ชจ๋ธ๋กœ Qwen3 8B๋ฅผ ๋Œ€์ฒดํ•ฉ๋‹ˆ๋‹ค. ํ–ฅ์ƒ๋œ ์ฝ”๋”ฉ ์„ฑ๋Šฅ, ๋‹ค๊ตญ์–ด ์ง€์›, VRAM 5 GB๋งŒ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋ฅธ ์ฝ”๋”ฉ ๋ชจ๋ธ์˜ VRAM ์š”๊ตฌ์‚ฌํ•ญ์— ๋Œ€ํ•œ ์ž์„ธํ•œ ์•ˆ๋‚ด๋Š” VRAM ์š”๊ตฌ์‚ฌํ•ญ ๊ฐ€์ด๋“œ โ†’๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค. `ollama run qwen3:8b`๋กœ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. ์ ˆ๋Œ€์ ์ธ ์ตœ์†Œ ์‚ฌ์–‘์ด ํ•„์š”ํ•˜๋‹ค๋ฉด DeepSeek V4 Flash๊ฐ€ ์˜ˆ์‚ฐ ๋Œ€์•ˆ์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”Insight: Qwen3 8B๋Š” Qwen3 8B์—์„œ ๊ฐœ์„ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค: ํ–ฅ์ƒ๋œ ๋‹ค๊ตญ์–ด ์ง€์›, ๋” ๋น ๋ฅธ ์ถ”๋ก , ์‹ค์ œ ์ž‘์—…์—์„œ ํ–ฅ์ƒ๋œ ์ฝ”๋“œ ํ’ˆ์งˆ. 8 GB ํ™˜๊ฒฝ์—์„œ๋Š” ํ˜„์žฌ ์ด ๋ชจ๋ธ์ด ๊ถŒ์žฅ ์ถœ๋ฐœ์ ์ž…๋‹ˆ๋‹ค.

์ฝ”๋”ฉ ๋ชจ๋ธ ๋น„๊ต: HumanEval + SWE-bench (2026๋…„ 6์›”)

ModelHumanEvalSWE-benchRAMFIM
Kimi K2.6 (MoE)โ€”58.6 (SWE-Bench Pro)๋‹ค์–‘ (์–‘์žํ™”)โ€”
Qwen 3.6 27Bโ€”77.2%22 GB์ง€์›
Devstral Small 24Bโ€”๋†’์Œ (์—์ด์ „ํŠธ)16 GB์ง€์›
Codestral 22Bโ€”โ€”14 GB์ง€์› (์ฃผ์š”)
Qwen3-Coder 32B87%โ€”20 GB์ง€์›
DeepSeek V4 Flashโ€”78/100 (์‹ค์ œ ํ™˜๊ฒฝ)~8 GB์ง€์›
Qwen3 8B~76%โ€”5 GB์ง€์›
DeepSeek-R1 14Bโ€”โ€”10 GB๋ฏธ์ง€์›

๐Ÿ“ŒNote: HumanEval์€ ๋‹จ์ผ ํ•จ์ˆ˜ Python ์ƒ์„ฑ์„ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค. SWE-bench๋Š” ์‹ค์ œ ๋ฉ€ํ‹ฐํŒŒ์ผ ์ฝ”๋“œ ๋ณ€๊ฒฝ์„ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค. '์‹ค์ œ ํ™˜๊ฒฝ' ์ ์ˆ˜๋Š” ๋…๋ฆฝ์ ์ธ ๋ฉ€ํ‹ฐํƒœ์Šคํฌ ์ฝ”๋”ฉ ๋ฒค์น˜๋งˆํฌ์—์„œ ๋‚˜์˜จ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋‘ ์ง€ํ‘œ ๋ชจ๋‘ ์œ ์˜๋ฏธํ•˜๋ฉฐ, SWE-bench๊ฐ€ ์‹ค์ œ ์ฝ”๋”ฉ ์„ฑ๋Šฅ์„ ๋” ์ž˜ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค.

์ด ๋ชจ๋ธ๋“ค์€ ์‹ค์ œ ์ฝ”๋”ฉ ์ž‘์—…์—์„œ ์–ด๋–ป๊ฒŒ ๋™์ž‘ํ•ฉ๋‹ˆ๊นŒ?

  1. 1
    Python ํ•จ์ˆ˜ ๋””๋ฒ„๊น… โ€” Kimi K2.6 (SWE-Bench Pro 58.6์ )์€ ๋ฒ„๊ทธ(์˜คํ”„๋ฐ”์ด์› ๋ฃจํ”„ ์กฐ๊ฑด)๋ฅผ 1โ€“2ํšŒ์˜ ์‘๋‹ต์œผ๋กœ ์ฐพ์•„๋ƒ…๋‹ˆ๋‹ค. Qwen 3.6 27B (SWE-bench 77.2%)๋Š” 2โ€“3๋ฒˆ์˜ ์‹œ๋„๋กœ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค. Codestral 22B๋Š” ์ •ํ™•ํ•œ ๊ฐ์ง€๋ฅผ ์œ„ํ•ด ์žฌํ‘œํ˜„์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์Šน์ž: ๋””๋ฒ„๊น… ์ •ํ™•๋„์™€ ์†๋„์—์„œ Kimi K2.6.
  2. 2
    ๋ฉ€ํ‹ฐํŒŒ์ผ ์ฝ”๋“œ ๋ฆฌํŒฉํ† ๋ง โ€” Qwen 3.6 27B๋Š” 27B ํŒŒ๋ผ๋ฏธํ„ฐ ์ „์ฒด๊ฐ€ ํ™œ์„ฑํ™”(๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ)๋˜์–ด ๋ฉ€ํ‹ฐํŒŒ์ผ ๋ณ€๊ฒฝ์— ํƒ์›”ํ•ฉ๋‹ˆ๋‹ค. Kimi K2.6 (MoE)๋Š” ํ† ํฐ๋งˆ๋‹ค ๋‹ค๋ฅด๊ฒŒ ๋ผ์šฐํŒ…๋˜์ง€๋งŒ ๋” ๋น ๋ฅด๊ฒŒ ์œ ์‚ฌํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋ƒ…๋‹ˆ๋‹ค. Devstral Small 24B๋Š” ํˆด ์ฝœ๋ง์„ ํ†ตํ•œ ๋ฉ€ํ‹ฐํŒŒ์ผ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์Šน์ž: ์ผ๊ด€๋œ ๋ฉ€ํ‹ฐํŒŒ์ผ ์ถ”๋ก ์—์„œ Qwen 3.6 27B.
  3. 3
    FIM / IDE ์ž๋™ ์™„์„ฑ (VS Code) โ€” Codestral 22B์™€ Qwen3 8B (Continue.dev ๊ฒฝ์œ ) ๋ชจ๋‘ ์ปค์„œ ์–‘์ชฝ ๋งฅ๋ฝ์„ ํ™œ์šฉํ•ด ๋ฉ€ํ‹ฐ๋ผ์ธ ํ•จ์ˆ˜ ๋ณธ๋ฌธ์„ ์ •ํ™•ํ•˜๊ฒŒ ์™„์„ฑํ•ฉ๋‹ˆ๋‹ค. Kimi K2.6๋Š” FIM์„ ์ง€์›ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค(ํ›ˆ๋ จ๋˜์ง€ ์•Š์Œ). ์Šน์ž: IDE ํ†ตํ•ฉ์—์„œ Codestral 22B์™€ Qwen3 8B.
  4. 4
    TypeScript ํƒ€์ž… ์ถ”๋ก  โ€” Kimi K2.6๋Š” ์œ ๋‹ˆ์˜จ ํƒ€์ž…๊ณผ ์ œ๋„ค๋ฆญ ์ œ์•ฝ ์กฐ๊ฑด์„ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์ถ”๋ก ํ•ฉ๋‹ˆ๋‹ค. Qwen 3.6 27B๋Š” ํƒ€์ž… ์ถ”๋ก  ์ž‘์—…์—์„œ 85% ์ด์ƒ์˜ ์ •ํ™•๋„๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค. Qwen3 8B๋Š” ๋ณต์žกํ•œ ํƒ€์ž… ์ •์ œ ํ”„๋กฌํ”„ํŠธ์˜ 15% ์ด์ƒ์—์„œ ์‹คํŒจํ•ฉ๋‹ˆ๋‹ค. ์Šน์ž: ๋ณต์žกํ•œ ํƒ€์ž… ์‹œ์Šคํ…œ๊ณผ ๋ฉ€ํ‹ฐํŒŒ์ผ ํƒ€์ž… ์ถ”์ ์—์„œ Kimi K2.6.

๐Ÿ”Insight: ์‹ค์ œ ์ฝ”๋”ฉ ์ž‘์—…(SWE-bench)์—์„œ๋Š” ๋Œ€ํ˜• ๋ชจ๋ธ์ด ์œ ๋ฆฌํ•ฉ๋‹ˆ๋‹ค. Kimi K2.6 (SWE-Bench Pro 58.6์ )๊ณผ Qwen 3.6 27B (SWE-bench 77.2%)๋Š” ์‹ค์šฉ์ ์ธ ๋””๋ฒ„๊น…๊ณผ ๋ฆฌํŒฉํ† ๋ง์—์„œ Qwen3 8B๋ณด๋‹ค ์•ฝ 5โ€“10% ๋” ๋†’์€ ์ ์ˆ˜๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค. ์ผ์ƒ์ ์ธ ์Šคํฌ๋ฆฝํŒ…์—์„œ๋Š” ๊ฒฉ์ฐจ๊ฐ€ ํฌ๊ฒŒ ์ขํ˜€์ง‘๋‹ˆ๋‹ค.

์–ด๋–ค ์ฝ”๋”ฉ ๋ชจ๋ธ์ด ์†๋„์™€ ์ถœ๋ ฅ ํ’ˆ์งˆ์˜ ๊ท ํ˜•์„ ๊ฐ€์žฅ ์ž˜ ๋งž์ถฅ๋‹ˆ๊นŒ?

TaskKimi K2.6Qwen 3.6 27BQwen3 8BCodestral 22B
REST API ์ƒ์„ฑ (100์ค„ ๋ณด์ผ๋Ÿฌํ”Œ๋ ˆ์ดํŠธ)18โ€“32 tok/sec | โœ“ ์˜ฌ๋ฐ”๋ฅธ ๋ผ์šฐํŠธ + ์˜ค๋ฅ˜ ์ฒ˜๋ฆฌ12โ€“18 tok/sec | โœ“ ์˜ฌ๋ฐ”๋ฅธ ๋ผ์šฐํŠธ30โ€“45 tok/sec | โš ๏ธ ์œ ํšจ์„ฑ ๊ฒ€์‚ฌ ๋ˆ„๋ฝ28โ€“38 tok/sec | โš ๏ธ ์ผ๋ฐ˜์ ์ธ ์ถœ๋ ฅ
SQL ์ฟผ๋ฆฌ ๋””๋ฒ„๊น… (๋ณต์žกํ•œ JOIN)15โ€“25 tok/sec | โœ“ ์˜ฌ๋ฐ”๋ฅธ ์ธ๋ฑ์Šค + ์ตœ์ ํ™” ํžŒํŠธ12โ€“20 tok/sec | โœ“ ์˜ฌ๋ฐ”๋ฅธ ์ธ๋ฑ์Šค20โ€“30 tok/sec | โš ๏ธ ๋ถ€๋ถ„์  ํ•ด๊ฒฐ18โ€“28 tok/sec | โœ— ์ž˜๋ชป๋œ ์ธ๋ฑ์Šค
๋‹จ์œ„ ํ…Œ์ŠคํŠธ ์ž‘์„ฑ (3โ€“5๊ฐœ ํ…Œ์ŠคํŠธ ์ผ€์ด์Šค)16โ€“28 tok/sec | โœ“ ์—ฃ์ง€ ์ผ€์ด์Šค + ๋ณด์•ˆ ์ปค๋ฒ„๋ฆฌ์ง€14โ€“22 tok/sec | โœ“ ์–‘ํ˜ธํ•œ ์ปค๋ฒ„๋ฆฌ์ง€28โ€“40 tok/sec | โš ๏ธ ์ •์ƒ ๊ฒฝ๋กœ๋งŒ25โ€“35 tok/sec | โš ๏ธ ์ •์ƒ ๊ฒฝ๋กœ๋งŒ
FIM ์ž๋™ ์™„์„ฑ (์ปค์„œ ์ค‘๊ฐ„)N/A (FIM ๋ฏธ์ง€์›)N/A (์ตœ์ ํ™” ์•ˆ๋จ)50+ tok/sec | โœ“ ์ •ํ™• (FIM)60+ tok/sec | โœ“ ๊ฐ€์žฅ ๋น ๋ฅด๊ณ  ์ •ํ™•ํ•œ FIM

๐Ÿ’กTip: ํ•ต์‹ฌ ์ธ์‚ฌ์ดํŠธ: Kimi K2.6์™€ Qwen 3.6 27B๋Š” ์ถ”๋ก  ์ž‘์—…(๋””๋ฒ„๊น…, SQL ์ตœ์ ํ™”, ๋ณด์•ˆ)์—์„œ ๋” ๋А๋ฆฌ์ง€๋งŒ ์ •ํ™•ํ•ฉ๋‹ˆ๋‹ค. Qwen3 8B๋Š” ์ƒ์„ฑ ์ž‘์—…(API ๋ณด์ผ๋Ÿฌํ”Œ๋ ˆ์ดํŠธ, ํ…Œ์ŠคํŠธ ์Šค์บํด๋”ฉ)์—์„œ ๋” ๋น ๋ฆ…๋‹ˆ๋‹ค. IDE ์ž๋™ ์™„์„ฑ์—๋Š” FIM ์ตœ์ ํ™” ๋ชจ๋ธ(Codestral 22B, Qwen3 8B)๋งŒ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๐Ÿ› ๏ธPractice: ์‹ค์šฉ์ ์ธ ๊ถŒ์žฅ ์‚ฌํ•ญ: ์ž‘์—… ์œ ํ˜•์— ๋”ฐ๋ผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. ์ผ๊ด„ ์ฝ”๋“œ ์ƒ์„ฑ์ด๋‚˜ ๋ฆฌํŒฉํ† ๋ง ๊ฒ€ํ† ์—๋Š” Qwen3-Coder 32B(๋†’์€ ํ’ˆ์งˆ, ํ—ˆ์šฉ ๊ฐ€๋Šฅํ•œ ์ง€์—ฐ)๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ์‹ค์‹œ๊ฐ„ IDE ์ž๋™ ์™„์„ฑ์—๋Š” Codestral 22B ๋˜๋Š” Qwen3 8B(์†๋„ ์ตœ์šฐ์„ )๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. 16 GB ํ™˜๊ฒฝ์—์„œ๋Š” DeepSeek-Coder V2 Lite๋กœ ๊ท ํ˜•์„ ๋งž์ถ”์‹ญ์‹œ์˜ค.

์–ด๋–ค ๋กœ์ปฌ ์ฝ”๋”ฉ LLM์„ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๊นŒ?

์„ ํƒํ•˜๋Š” ๋ชจ๋ธ๋„ ์ค‘์š”ํ•˜์ง€๋งŒ, ์ฝ”๋“œ ํ’ˆ์งˆ์„ ์œ„ํ•ด์„œ๋Š” ํ”„๋กฌํ”„ํŠธ ์ž‘์„ฑ ๋ฐฉ์‹์ด ๋” ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ์–ธ์–ด, ์ œ์•ฝ ์กฐ๊ฑด, ํ…Œ์ŠคํŠธ ์ผ€์ด์Šค, ์ถœ๋ ฅ ํ˜•์‹์„ ๋ช…ํ™•ํžˆ ์ง€์ •ํ•˜๋Š” ๊ตฌ์กฐํ™”๋œ ํ”„๋กฌํ”„ํŒ… ๊ธฐ๋ฒ•์€ ์ฝ”๋“œ ์ƒ์„ฑ ์ •ํ™•๋„๋ฅผ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง ๊ฐ€์ด๋“œ์—์„œ๋Š” ๊ธฐ์ดˆ, ํ”„๋ ˆ์ž„์›Œํฌ, ํ‰๊ฐ€ ๋ฐฉ๋ฒ•์— ๊ฑธ์นœ 80๊ฐ€์ง€ ๊ธฐ๋ฒ•์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค.

์ด ๋ชจ๋ธ๋“ค์„ ์ค‘์‹ฌ์œผ๋กœ ๊ตฌ์„ฑ๋œ ์™„์ „ํ•œ IDE ์›Œํฌํ”Œ๋กœ์šฐ์— ๋Œ€ํ•ด์„œ๋Š” GitHub Copilot์„ ๋กœ์ปฌ LLM์œผ๋กœ ๊ต์ฒดํ•˜๊ธฐ๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค. ์œ„์˜ ์„ ํƒ ๋ชจ๋ธ๊ณผ ์ž˜ ์–ด์šธ๋ฆฌ๋Š” ์˜คํ”ˆ์†Œ์Šค ์Šคํƒ(Continue.dev + Ollama + Qwen3-Coder)์ž…๋‹ˆ๋‹ค.

  • 8 GB RAM, ์ฝ”๋”ฉ ์ง‘์ค‘: `ollama run qwen3:8b` โ€” VRAM 5 GB ์‚ฌ์šฉ, ์ด ๊ตฌ๊ฐ„ ์ตœ๊ณ  ๋ชจ๋ธ.
  • 16 GB RAM: `ollama run devstral-small:24b` โ€” ์—์ด์ „ํŠธ ์ฝ”๋”ฉ์— ์ตœ์  (๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘, ๋””๋ฒ„๊น… ๋ฃจํ”„), 16 GB VRAM.
  • 20 GB ์ด์ƒ RAM (์ตœ๊ณ  ํ’ˆ์งˆ): `ollama run kimi-k2.6` (์–‘์žํ™”) ๋˜๋Š” `ollama run qwen3.6:27b` โ€” Kimi K2.6 SWE-Bench Pro 58.6์ , Qwen 3.6 SWE-bench 77.2%.
  • VS Code์—์„œ IDE ์ž๋™ ์™„์„ฑ: Continue.dev ๊ฒฝ์œ  `ollama run codestral:22b` โ€” FIM ์ตœ์ ํ™”, ์ตœ๊ณ ์˜ ๋กœ์ปฌ Copilot ๋Œ€์•ˆ.
  • ์ด๋ฏธ ๋‹ค๋ฅธ ๋ชจ๋ธ ์‚ฌ์šฉ ์ค‘: ๊ตฌํ˜• ๋ชจ๋ธ์„ ์‹คํ–‰ ์ค‘์ด๋ผ๋ฉด Qwen3 8B๋กœ ์—…๊ทธ๋ ˆ์ด๋“œํ•˜์‹ญ์‹œ์˜ค โ€” ์ƒ๋‹นํ•œ ํ’ˆ์งˆ ํ–ฅ์ƒ.
ํ•˜๋“œ์›จ์–ด ๋งž์ถค ๋ชจ๋ธ ์„ ํƒ (2026๋…„ 6์›”): 8 GB RAM โ†’ Qwen3 8B (VRAM 5 GB, ํ–ฅ์ƒ๋œ ์ฝ”๋”ฉ); 16 GB RAM โ†’ Devstral Small 24B (VRAM 16 GB, ์—์ด์ „ํŠธ ์ฝ”๋”ฉ) ๋˜๋Š” Qwen 3.6 27B (SWE-bench 77.2%); 20 GB ์ด์ƒ RAM โ†’ ์–‘์žํ™”๋œ Kimi K2.6 (SWE-Bench Pro 58.6์ , ์ตœ๊ณ  ๋กœ์ปฌ ํ’ˆ์งˆ).
ํ•˜๋“œ์›จ์–ด ๋งž์ถค ๋ชจ๋ธ ์„ ํƒ (2026๋…„ 6์›”): 8 GB RAM โ†’ Qwen3 8B (VRAM 5 GB, ํ–ฅ์ƒ๋œ ์ฝ”๋”ฉ); 16 GB RAM โ†’ Devstral Small 24B (VRAM 16 GB, ์—์ด์ „ํŠธ ์ฝ”๋”ฉ) ๋˜๋Š” Qwen 3.6 27B (SWE-bench 77.2%); 20 GB ์ด์ƒ RAM โ†’ ์–‘์žํ™”๋œ Kimi K2.6 (SWE-Bench Pro 58.6์ , ์ตœ๊ณ  ๋กœ์ปฌ ํ’ˆ์งˆ).

๐Ÿ› ๏ธPractice: ๋จผ์ € ํ•˜๋“œ์›จ์–ด์— ๋งž๋Š” ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์„ ํƒํ•œ ํ›„ ์šฉ๋„์— ๋งž๊ฒŒ ์ตœ์ ํ™”ํ•˜์‹ญ์‹œ์˜ค. 8 GB์ด๋ฉด Qwen3 8B๊ฐ€ ์ตœ์„ ์ž…๋‹ˆ๋‹ค. 16 GB ์ด์ƒ์ด๋ฉด ๋ˆˆ์— ๋„๊ฒŒ ํ–ฅ์ƒ๋œ ์ถ”๋ก ์„ ์œ„ํ•ด Devstral Small 24B ๋˜๋Š” Qwen 3.6 27B๋กœ ์—…๊ทธ๋ ˆ์ด๋“œํ•˜์‹ญ์‹œ์˜ค. ์ž˜ ์‹คํ–‰๋˜๋Š” ๋ชจ๋ธ์ด ๊ฒจ์šฐ ๋Œ์•„๊ฐ€๋Š” ์™„๋ฒฝํ•œ ๋ชจ๋ธ๋ณด๋‹ค ๋‚ซ์Šต๋‹ˆ๋‹ค.

8 GB VRAM ์ตœ๊ณ  ์ฝ”๋”ฉ LLM (RTX 3060 12GB / RTX 3070 8GB / RX 6800 16GB)

8 GB RAM ํ™˜๊ฒฝ์—์„œ๋Š” Qwen3 8B๊ฐ€ ์ฝ”๋”ฉ์— ์ตœ์ ์ž…๋‹ˆ๋‹ค. HumanEval 72% ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ VRAM์„ 5 GB๋งŒ ์‚ฌ์šฉํ•˜์—ฌ IDE, ๋ธŒ๋ผ์šฐ์ €, ๊ธฐํƒ€ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์œ„ํ•œ 3 GB๊ฐ€ ๋‚จ์Šต๋‹ˆ๋‹ค. Qwen3 8B๋Š” Continue.dev๋ฅผ ํ†ตํ•œ VS Code ์ž๋™ ์™„์„ฑ์„ ์œ„ํ•œ FIM(fill-in-the-middle)์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

  • Qwen3 8B (๊ถŒ์žฅ) โ€” HumanEval 72%, VRAM 5 GB, 20โ€“35 tok/sec, FIM ์ง€์›. `ollama run qwen3:8b`
  • Phi-4 Mini 3.8B โ€” MMLU 68% (์ถ”๋ก ), VRAM 2.5 GB, ๊ฒฝ๋Ÿ‰ ์ถ”๋ก ์— ์ตœ์ . `ollama run phi:3.8`
  • Llama 3.2 3B โ€” 40โ€“60 tok/sec, VRAM 2.5 GB, ๋งค์šฐ ์ œํ•œ๋œ ํ™˜๊ฒฝ์˜ ๋Œ€์•ˆ. `ollama run llama3.2:3b`

16 GB VRAM ์ตœ๊ณ  ์ฝ”๋”ฉ LLM (RTX 4070 12GB / RTX 4070 Ti 16GB / RTX 5000 24GB)

16 GB RAM ํ™˜๊ฒฝ์—์„œ๋Š” Devstral Small 24B ๋˜๋Š” Qwen 3.6 27B๋ฅผ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Devstral Small์€ ์—์ด์ „ํŠธ ์›Œํฌํ”Œ๋กœ์šฐ(๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘, ํˆด ์ฝœ๋ง, ๋””๋ฒ„๊น… ๋ฃจํ”„)์— ์ตœ์ ์ž…๋‹ˆ๋‹ค. Qwen 3.6 27B๋Š” ๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ํ™œ์„ฑํ™”(MoE ์˜ค๋ฒ„ํ—ค๋“œ ์—†์Œ)๋˜์–ด ์ตœ๊ณ  ํ’ˆ์งˆ(SWE-bench 77.2%)์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

  • Devstral Small 24B โ€” ์—์ด์ „ํŠธ ์ฝ”๋”ฉ์— ์ตœ์ , ํˆด ์ฝœ๋ง, ๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘, VRAM 16 GB, 15โ€“25 tok/sec. `ollama run devstral-small:24b`
  • Qwen 3.6 27B โ€” ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ, SWE-bench 77.2%, ์ผ๊ด€๋œ ์ถ”๋ก , VRAM 22 GB (RTX 4090์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅ). `ollama run qwen3.6:27b`
  • DeepSeek-Coder V2 HumanEval 81%, MoE ํšจ์œจ, 16 GB์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅ. `ollama run deepseek-coder-v2`

6 GB VRAM ์ตœ๊ณ  ์ฝ”๋”ฉ LLM (๋ณด๊ธ‰ํ˜• GPU / ๋‚ด์žฅ ๊ทธ๋ž˜ํ”ฝ)

4โ€“6 GB VRAM ํ™˜๊ฒฝ(๋ณด๊ธ‰ํ˜• GPU, ๊ตฌํ˜• ๋…ธํŠธ๋ถ, Intel iGPU)์—์„œ๋Š” Phi-4 Mini 3.8B๊ฐ€ ์ตœ์„ ์ž…๋‹ˆ๋‹ค. MMLU ์ถ”๋ก  ์„ฑ๋Šฅ 68%๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉด์„œ VRAM์„ 2.5 GB๋งŒ ์‚ฌ์šฉํ•˜์—ฌ ์‹œ์Šคํ…œ์„ ์œ„ํ•œ ~3.5 GB๊ฐ€ ๋‚จ์Šต๋‹ˆ๋‹ค.

  • Phi-4 Mini 3.8B (๊ถŒ์žฅ) โ€” MMLU ์ถ”๋ก  68%, VRAM 2.5 GB, ๋…ผ๋ฆฌ ๋ฐ ๋””๋ฒ„๊น…์— ํƒ์›”. `ollama run phi:3.8`
  • Qwen3 4B โ€” ์†Œํ˜• ๋ณ€ํ˜•, VRAM 4 GB, ๋ณด๊ธ‰ํ˜• ํ•˜๋“œ์›จ์–ด์—์„œ ๊ท ํ˜• ์žกํžŒ ํ’ˆ์งˆ-์†๋„. `ollama run qwen3:4b`

๐Ÿงญ ์‚ฌ์šฉ์ž ์œ ํ˜•๋ณ„ ์ถ”์ฒœ

  • ์ดˆ๋ณด์ž (๋กœ์ปฌ LLM ๊ฒฝํ—˜ ์—†์Œ): LM Studio + Qwen3 8B โ€” GUI ์ œ๊ณต, ํ„ฐ๋ฏธ๋„ ๋ถˆํ•„์š”, ์ฝ”๋“œ ์™„์„ฑ์„ ์œ„ํ•œ FIM ํฌํ•จ, VRAM 5 GB.
  • ๋…ธํŠธ๋ถ ๊ฐœ๋ฐœ์ž (8โ€“16 GB RAM, ์ผ์ƒ์  ์ฝ”๋”ฉ): Ollama + Qwen3 8B (8 GB ํ™˜๊ฒฝ) ๋˜๋Š” Devstral Small 24B (16 GB ํ™˜๊ฒฝ) โ€” ๊ท ํ˜• ์žกํžŒ ํ’ˆ์งˆ๊ณผ ์„ฑ๋Šฅ, ์žฅ์‹œ๊ฐ„ ์•ˆ์ •์ ์œผ๋กœ ์‹คํ–‰๋จ.
  • ๊ณ ๊ธ‰ ๊ฐœ๋ฐœ์ž (๋””๋ฒ„๊น…, ๋ฆฌํŒฉํ† ๋ง, ๋ณต์žกํ•œ ์ถ”๋ก ): Ollama + Qwen 3.6 27B (๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ, ์ผ๊ด€๋œ ์ถ”๋ก ) ๋˜๋Š” Kimi K2.6 (์–‘์žํ™”, SWE-Bench Pro 58.6์  ์ตœ๊ณ  ํ’ˆ์งˆ) โ€” ๋ฉ€ํ‹ฐํŒŒ์ผ ๋งฅ๋ฝ๊ณผ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์„ค๊ณ„ ์ฒ˜๋ฆฌ.
  • IDE ์ค‘์‹ฌ ์›Œํฌํ”Œ๋กœ์šฐ (VS Code, Cursor, JetBrains): Continue.dev + Codestral 22B โ€” ์ปค์„œ ์œ„์น˜์—์„œ ์—๋””ํ„ฐ ๋‚ด ์ฝ”๋“œ ์™„์„ฑ์„ ์œ„ํ•œ FIM ์ตœ์ ํ™”, ์ตœ๊ณ ์˜ ๋กœ์ปฌ Copilot ๋Œ€์•ˆ.
  • ๋ณด์•ˆ์ด ์ค‘์š”ํ•œ ํ™˜๊ฒฝ (GDPR, HIPAA, ๋…์  ์ฝ”๋“œ): Ollama๋ฅผ ํ†ตํ•œ ์œ„์˜ ๋ชจ๋“  ๋ชจ๋ธ โ€” ์™ธ๋ถ€ API ํ˜ธ์ถœ ์—†์Œ, 100% ์˜จํ”„๋ ˆ๋ฏธ์Šค, ์ฝ”๋“œ๊ฐ€ ์‹œ์Šคํ…œ ๋ฐ–์œผ๋กœ ๋‚˜๊ฐ€์ง€ ์•Š์Œ.

โš ๏ธWarning: โŒ ํ”ผํ•˜์‹ญ์‹œ์˜ค: Qwen 3.6 27B (22 GB)๋ฅผ 20 GB ๋ฏธ๋งŒ์˜ ์—ฌ์œ  RAM์ด ์žˆ๋Š” ์‹œ์Šคํ…œ์—์„œ ์‹คํ–‰ํ•˜๋Š” ๊ฒƒ. ์ง€์—ฐ ์‹œ๊ฐ„์ด ์‚ฌ์šฉ ๋ถˆ๊ฐ€๋Šฅํ•œ ์ˆ˜์ค€(1โ€“3 ํ† ํฐ/์ดˆ)์ด ๋ฉ๋‹ˆ๋‹ค. ์†Œํ˜• ์‹œ์Šคํ…œ์—์„œ๋Š” Qwen3 8B ๋˜๋Š” Devstral Small 24B๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

โš ๏ธWarning: โŒ ํ”ผํ•˜์‹ญ์‹œ์˜ค: IDE ์ž๋™ ์™„์„ฑ์ด ํ•„์š”ํ•  ๋•Œ ๋ฒ”์šฉ ๋ชจ๋ธ(Llama 3.3 8B)์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ. FIM ์ง€์›์ด ์žˆ๋Š” ์ฝ”๋“œ ํŠนํ™” ๋ชจ๋ธ๋งŒ ์—๋””ํ„ฐ ๋‚ด ์ž๋™ ์™„์„ฑ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค โ€” Codestral 22B, Qwen3 8B.

๐Ÿ”Insight: ์ดˆ๋ณด์ž โ†’ ์ค‘๊ธ‰์ž โ†’ ๊ณ ๊ธ‰์ž๋Š” ํ•˜๋“œ์›จ์–ด ์š”๊ตฌ์‚ฌํ•ญ์˜ ์ง„ํ–‰์ด๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค. Qwen3 8B (8 GB)๋กœ ์‹œ์ž‘ํ•˜๊ณ , ๋„๊ตฌ์™€ ์›Œํฌํ”Œ๋กœ์šฐ๊ฐ€ ๋Š˜์–ด๋‚จ์— ๋”ฐ๋ผ Devstral Small 24B (16 GB)๋กœ ์—…๊ทธ๋ ˆ์ด๋“œํ•˜๋ฉฐ, ์ตœ๊ณ ์˜ ์ถ”๋ก  ํ’ˆ์งˆ์ด ํ•„์š”ํ•  ๋•Œ๋งŒ Qwen 3.6 27B ๋˜๋Š” Kimi K2.6 (20 GB ์ด์ƒ)์œผ๋กœ ์ง„ํ–‰ํ•˜์‹ญ์‹œ์˜ค.

โŒ ์ฝ”๋”ฉ์— ๋กœ์ปฌ LLM์„ ์‚ฌ์šฉํ•˜์ง€ ๋ง์•„์•ผ ํ•  ๋•Œ

  • ์ตœ์‹  ํ”„๋ ˆ์ž„์›Œํฌ ์ง€์‹ (2025๋…„ ์ดํ›„ API)์ด ํ•„์š”ํ•  ๋•Œ: ๋กœ์ปฌ ๋ชจ๋ธ์€ ๊ณ ์ •๋œ ํ•™์Šต ๋งˆ๊ฐ์ผ์„ ๊ธฐ์ค€์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค. Qwen3-Coder๋Š” 2024๋…„ 3๋ถ„๊ธฐ๊นŒ์ง€, DeepSeek-Coder๋Š” 2024๋…„ ์ค‘๋ฐ˜๊นŒ์ง€ ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ ํ•™์Šต ์ดํ›„ ์ถœ์‹œ๋œ Vue 3.5, Next.js 15, Python 3.13 API์—๋Š” ์ง€์†์ ์œผ๋กœ ์—…๋ฐ์ดํŠธ๋˜๋Š” GPT-5.5 ๋˜๋Š” Claude Sonnet 4.6์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • ๋Œ€ํ˜• ์ฝ”๋“œ๋ฒ ์ด์Šค (100k+ ํ† ํฐ)์—์„œ ๋ฉ€ํ‹ฐํŒŒ์ผ ์ถ”๋ก ์ด ํ•„์š”ํ•  ๋•Œ: ๋กœ์ปฌ ๋ชจ๋ธ์€ ๋งค์šฐ ๊ธด ์ปจํ…์ŠคํŠธ์—์„œ ์„ฑ๋Šฅ์ด ์ €ํ•˜๋ฉ๋‹ˆ๋‹ค. ์ง€์—ฐ ์‹œ๊ฐ„์ด ํ—ˆ์šฉ ๋ถˆ๊ฐ€๋Šฅํ•ด์ง‘๋‹ˆ๋‹ค. ํด๋ผ์šฐ๋“œ ๋ชจ๋ธ (GPT-5.5, Claude)์€ 100k+ ํ† ํฐ ์ปจํ…์ŠคํŠธ๋ฅผ ๊ธฐ๋ณธ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ์ „์ฒด ์„œ๋น„์Šค์˜ ์•„ํ‚คํ…์ฒ˜ ๋ฆฌํŒฉํ† ๋ง์—๋Š” ํด๋ผ์šฐ๋“œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • ์ง€์—ฐ ์‹œ๊ฐ„์ด 300ms ๋ฏธ๋งŒ์ด์–ด์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ (์‹ค์‹œ๊ฐ„ ๋Œ€ํ™”ํ˜• ์ฝ”๋”ฉ): ๋กœ์ปฌ ๋ชจ๋ธ์€ CPU์—์„œ 15โ€“25 ํ† ํฐ/์ดˆ๋กœ ์‹คํ–‰๋˜์–ด(์ผ๋ฐ˜ ๋…ธํŠธ๋ถ ๊ธฐ์ค€) ์‘๋‹ต๋‹น 5โ€“10์ดˆ์˜ ์ง€์—ฐ์ด ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. GitHub Copilot๊ณผ Claude๋Š” IDE์—์„œ 1์ดˆ ์ด๋‚ด์— ์ œ์•ˆ์„ ์™„์„ฑํ•ฉ๋‹ˆ๋‹ค. ํ‚ค์ŠคํŠธ๋กœํฌ ์ˆ˜์ค€์˜ ์ž๋™ ์™„์„ฑ์—๋Š” ๋กœ์ปฌ ๋ชจ๋ธ์ด ๋„ˆ๋ฌด ๋А๋ฆฝ๋‹ˆ๋‹ค.
  • ์ตœ๊ณ  ์ˆ˜์ค€์˜ ๋””๋ฒ„๊น… ์ •ํ™•๋„๊ฐ€ ํ•„์š”ํ•  ๋•Œ: ๋ณต์žกํ•œ ๋””๋ฒ„๊น… ์ž‘์—…(์—ฌ๋Ÿฌ ํ•จ์ˆ˜ ํ˜ธ์ถœ ์Šคํƒ ์ถ”์ , ๋ฏธ๋ฌ˜ํ•œ ํƒ€์ž… ์˜ค๋ฅ˜ ์‹๋ณ„)์—์„œ GPT-5.5์™€ Claude Sonnet 4.6์€ ์‹ค์ œ ์ฝ”๋“œ ์ด์Šˆ์—์„œ ๋กœ์ปฌ ๋ชจ๋ธ๋ณด๋‹ค 15โ€“20% ๋” ๋†’์€ ์ ์ˆ˜๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ ๋ชจ๋ธ์€ ์ƒ์„ฑ์— ๋›ฐ์–ด๋‚˜๊ณ , ์ตœ์ฒจ๋‹จ ๋ชจ๋ธ์€ ์ง„๋‹จ์— ๋›ฐ์–ด๋‚ฉ๋‹ˆ๋‹ค.
  • ์ƒ์„ฑ๋œ ์ฝ”๋“œ์˜ ํ™˜๊ฐ์„ ํ—ˆ์šฉํ•  ์ˆ˜ ์—†์„ ๋•Œ: ๋กœ์ปฌ 7B ๋ชจ๋ธ์€ ๋ณต์žกํ•œ ์ž‘์—…์—์„œ ์•ฝ 2%์˜ ๋น„์œจ๋กœ ๊ตฌ๋ฌธ์ ์œผ๋กœ ์œ ํšจํ•˜์ง€๋งŒ ๋…ผ๋ฆฌ์ ์œผ๋กœ ์ž˜๋ชป๋œ ์ฝ”๋“œ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ํด๋ผ์šฐ๋“œ ๋ชจ๋ธ์€ 0.5% ๋ฏธ๋งŒ์˜ ํ™˜๊ฐ ๋น„์œจ์„ ๋ณด์ž…๋‹ˆ๋‹ค. ๋ฏธ์…˜ ํฌ๋ฆฌํ‹ฐ์ปฌ ์ฝ”๋“œ(๊ฒฐ์ œ ์‹œ์Šคํ…œ, ๋ณด์•ˆ)์—๋Š” ์ธ๊ฐ„ ๊ฒ€ํ† ๊ฐ€ ํ•„์š”ํ•˜๊ฑฐ๋‚˜ ์ตœ์ฒจ๋‹จ API๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๐Ÿ”Insight: ๐Ÿ‘‰ ๋กœ์ปฌ LLM์˜ ๊ฐ•์ : ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ + ์˜คํ”„๋ผ์ธ ์ž‘์—… + ๋น„์šฉ ์ ˆ๊ฐ โ€” ์ตœ๊ณ  ์„ฑ๋Šฅ์„ ์œ„ํ•œ ๊ฒƒ์ด ์•„๋‹™๋‹ˆ๋‹ค. ์ด ์„ธ ๊ฐ€์ง€ ์š”์†Œ๋ณด๋‹ค ์ตœ๋Œ€ ์ •ํ™•๋„๊ฐ€ ๋” ์ค‘์š”ํ•˜๋‹ค๋ฉด ํด๋ผ์šฐ๋“œ API๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๐Ÿ“Š ์ฝ”๋”ฉ์šฉ ์ตœ๊ณ  ๋กœ์ปฌ LLM ๋น„๊ต (์˜์‚ฌ๊ฒฐ์ • ๋งคํŠธ๋ฆญ์Šค)

์–ด๋–ค ์ฝ”๋”ฉ ๋ชจ๋ธ์„ ์„ ํƒํ•ด์•ผ ํ• ์ง€ ๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๊นŒ? PromptQuorum์„ ์‚ฌ์šฉํ•˜๋ฉด ํ•˜๋‚˜์˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์—ฌ๋Ÿฌ ๋ชจ๋ธ(Kimi K2.6, Qwen 3.6, Devstral, GPT-5.5, Claude)์— ๋™์‹œ์— ์ „์†กํ•˜๊ณ  ์‹ค์ œ ์ฝ”๋“œ์— ๋Œ€ํ•œ ๋‚˜๋ž€ํžˆ ๋ณด๊ธฐ ์ถœ๋ ฅ, ์‹ค์ œ ์‘๋‹ต ์‹œ๊ฐ„, ์ •ํ™•๋„๋ฅผ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. PromptQuorum ๋ฌด๋ฃŒ ์ฒดํ—˜ โ€” 5๋ถ„, ํšŒ์›๊ฐ€์ž… ๋ถˆํ•„์š”.

ModelBest ForVRAMSpeedStrengthWhen to Pick
Kimi K2.6 (์–‘์žํ™”)์ตœ๋Œ€ ๋กœ์ปฌ ํ’ˆ์งˆ, ์‹ค์ œ ํ™˜๊ฒฝ ๋ฒค์น˜๋งˆํฌ๋‹ค์–‘ (์–‘์žํ™”)15โ€“25 tok/secSWE-Bench Pro 58.6์ , MoE (32B ํ™œ์„ฑ / 1T ์ „์ฒด), Modified MIT ๋ผ์ด์„ ์Šค๋””๋ฒ„๊น…/๋ฆฌํŒฉํ† ๋ง์„ ์œ„ํ•œ ์ตœ๋Œ€ ๋กœ์ปฌ ํ’ˆ์งˆ๊ณผ ์˜คํ”„๋ผ์ธ ๊ธฐ๋Šฅ์ด ํ•„์š”ํ•  ๋•Œ
Qwen 3.6 27B์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ, ๋ฉ€ํ‹ฐํŒŒ์ผ ์ถ”๋ก ~22 GB12โ€“20 tok/secSWE-bench 77.2%, ๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ ํ™œ์„ฑ, ์ผ๊ด€๋œ ์ถ”๋ก 22 GB ์ด์ƒ์˜ RAM์ด ์žˆ๊ณ  ๋Œ€์šฉ๋Ÿ‰ ํŒŒ์ผ์—์„œ ์˜ˆ์ธก ๊ฐ€๋Šฅํ•œ ์„ฑ๋Šฅ์„ ์›ํ•  ๋•Œ
Devstral Small 24B์—์ด์ „ํŠธ ์ฝ”๋”ฉ ์›Œํฌํ”Œ๋กœ์šฐ~16 GB15โ€“25 tok/sec๋ฉ€ํ‹ฐํŒŒ์ผ ํŽธ์ง‘, ํˆด ์ฝœ๋ง, ์˜ค๋ฅ˜ ๋ณต๊ตฌ, ์˜ค๋ฅ˜ ๋ฃจํ”„aider, ๋‹ค๋‹จ๊ณ„ ์›Œํฌํ”Œ๋กœ์šฐ, Claude Code ์Šคํƒ€์ผ ์—์ด์ „ํŠธ๋ฅผ ์‚ฌ์šฉํ•  ๋•Œ
Codestral 22BIDE ์ž๋™ ์™„์„ฑ (VS Code, Cursor)~14 GB20โ€“30 tok/secFIM ์ตœ์ ํ™”, ์ตœ๊ณ ์˜ ๋กœ์ปฌ Copilot ๋Œ€์•ˆ, Continue.dev ๊ธฐ๋ณธ ํ†ตํ•ฉContinue.dev๋ฅผ ํ†ตํ•ด ํ‚ค์ŠคํŠธ๋กœํฌ ์ˆ˜์ค€์˜ IDE ์ž๋™ ์™„์„ฑ์„ ์›ํ•  ๋•Œ
Qwen3 8B๋…ธํŠธ๋ถ ์ฝ”๋”ฉ, 8 GB RAM ์ตœ์ ~5 GB30โ€“45 tok/sec์ด ๊ตฌ๊ฐ„์—์„œ ๊ฐ€์žฅ ๋น ๋ฆ„, ํ–ฅ์ƒ๋œ ์ฝ”๋”ฉ, FIM ์ง€์›, ๋‹ค๊ตญ์–ด8 GB RAM์ด ์žˆ๊ณ  ํ•ด๋‹น ๊ตฌ๊ฐ„์˜ ์ตœ๊ณ  ๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ์„ ์›ํ•  ๋•Œ
GPT-5.5 (ํด๋ผ์šฐ๋“œ)์ตœ์‹  API, ๋ณต์žกํ•œ ์ถ”๋ก , ์ตœ๊ณ  ์„ฑ๋ŠฅN/A (ํด๋ผ์šฐ๋“œ)<1์ดˆ์ตœ๊ณ  ์ •ํ™•๋„, ์ตœ๊ทผ ํ•™์Šต ๋งˆ๊ฐ์ผ, ๋ฉ€ํ‹ฐํŒŒ์ผ ์ถ”๋ก ์ตœ๊ณ  ์„ฑ๋Šฅ, ์‹ค์‹œ๊ฐ„ ์ง€์—ฐ, ๋˜๋Š” ์ตœ์‹  ํ”„๋ ˆ์ž„์›Œํฌ ์ง€์‹์ด ํ•„์š”ํ•  ๋•Œ
Claude Sonnet 4.6 (ํด๋ผ์šฐ๋“œ)์ฝ”๋“œ ๋ฆฌ๋ทฐ, ์•„ํ‚คํ…์ฒ˜ ๊ฒฐ์ •, ๋””๋ฒ„๊น… ์ •ํ™•๋„N/A (ํด๋ผ์šฐ๋“œ)<1์ดˆ์ฝ”๋“œ ์ดํ•ด, ๋””๋ฒ„๊น…, ๋ฉ€ํ‹ฐํŒŒ์ผ ์ปจํ…์ŠคํŠธ์— ์ตœ์ ๋น„์šฉ์ด๋‚˜ ๊ฐœ์ธ์ •๋ณด๋ณด๋‹ค ๋””๋ฒ„๊น… ์ •ํ™•๋„์™€ ์ฝ”๋“œ ๋ฆฌ๋ทฐ๋ฅผ ์šฐ์„ ์‹œํ•  ๋•Œ

์ง€์—ญ๋ณ„ ์š”๊ตฌ์‚ฌํ•ญ์ด ์ฝ”๋”ฉ ๋ชจ๋ธ ์„ ํƒ์— ์–ด๋–ค ์˜ํ–ฅ์„ ๋ฏธ์นฉ๋‹ˆ๊นŒ?

EU / GDPR

๋…์  ์ฝ”๋“œ๋ฒ ์ด์Šค๋ฅผ ๋‹ค๋ฃจ๋Š” EU ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ ํŒ€์˜ ๊ฒฝ์šฐ, ๋กœ์ปฌ ์ฝ”๋“œ ์ƒ์„ฑ์„ ์‚ฌ์šฉํ•˜๋ฉด ์†Œ์Šค ์ฝ”๋“œ๊ฐ€ ์กฐ์ง์˜ ์ธํ”„๋ผ ๋ฐ–์œผ๋กœ ๋‚˜๊ฐ€์ง€ ์•Š์Šต๋‹ˆ๋‹ค. GDPR ์ œ32์กฐ๋Š” ์ ์ ˆํ•œ ๊ธฐ์ˆ ์  ๋ณด์•ˆ ์กฐ์น˜๋ฅผ ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค โ€” ์†Œ์Šค ์ฝ”๋“œ๋ฅผ ํด๋ผ์šฐ๋“œ AI API์— ์ „์†กํ•˜๋ฉด ์ œ28์กฐ์— ๋”ฐ๋ฅธ ์ถ”๊ฐ€์ ์ธ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ์ž ๊ด€๊ณ„๊ฐ€ ํ˜•์„ฑ๋ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ ์ถ”๋ก ์€ ์ด๋ฅผ ์ œ๊ฑฐํ•ฉ๋‹ˆ๋‹ค.

Qwen3-Coder 32B (Alibaba, Apache 2.0)์™€ DeepSeek-Coder V2 (DeepSeek, MIT) ๋ชจ๋‘ ์™„์ „ํ•œ ์˜จํ”„๋ ˆ๋ฏธ์Šค ์‹คํ–‰์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. EU ๋‚ด์—์„œ EU ์ถœ์‹  ๋ชจ๋ธ์„ ์„ ํ˜ธํ•˜๋Š” ์กฐ์ง์˜ ๊ฒฝ์šฐ: Mistral AI (ํ”„๋ž‘์Šค)์˜ ์ฝ”๋”ฉ ์ง€์› ๋ชจ๋ธ(Mistral Small 3.1, Codestral)์ด Apache 2.0 ๋ผ์ด์„ ์Šค๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. EU AI ๋ฒ•(2025๋…„ 2์›” ์‹œํ–‰)์€ ์ค‘์š” ์ธํ”„๋ผ๋ฅผ ์œ„ํ•œ AI ์ง€์› ์ฝ”๋“œ ์ƒ์„ฑ์„ ์ž ์žฌ์ ์œผ๋กœ ๊ณ ์œ„ํ—˜์œผ๋กœ ๋ถ„๋ฅ˜ํ•ฉ๋‹ˆ๋‹ค โ€” ์˜จํ”„๋ ˆ๋ฏธ์Šค ์ถ”๋ก ์€ ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ธฐ์กด ๋ณด์•ˆ ๊ฒฝ๊ณ„ ๋‚ด์— ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค.

์ผ๋ณธ (METI)

METI ์‚ฌ์ด๋ฒ„๋ณด์•ˆ ์ง€์นจ์€ ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ์—์„œ์˜ AI ๋„๊ตฌ ์‚ฌ์šฉ์„ ์ ์  ๋” ๋‹ค๋ฃจ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. Qwen3-Coder๋Š” ์ผ๋ณธ์–ด ์ฝ”๋“œ ์ฃผ์„๊ณผ ๋ณ€์ˆ˜ ๋ช…๋ช… ๊ทœ์น™์„ ๊ธฐ๋ณธ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค โ€” ์ผ๋ณธ์–ด ์ธ๋ผ์ธ ๋ฌธ์„œ๊ฐ€ ์žˆ๋Š” ์ผ๋ณธ ๊ฐœ๋ฐœ ์ฝ”๋“œ๋ฒ ์ด์Šค์— ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ทœ์ • ์ค€์ˆ˜ ๊ธฐ๋ก์„ ์œ„ํ•ด Ollama ํƒœ๊ทธ(์˜ˆ: qwen2.5-coder:32b)๋Š” METI AI ๊ฑฐ๋ฒ„๋„Œ์Šค ๋ฌธ์„œ์— ํ•„์š”ํ•œ ์ •ํ™•ํ•œ ๋ฒ„์ „ ์‹๋ณ„์ž๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์ค‘๊ตญ

์ค‘๊ตญ์˜ ๋ฐ์ดํ„ฐ๋ณด์•ˆ๋ฒ•(ๆ•ฐๆฎๅฎ‰ๅ…จๆณ•)์— ๋”ฐ๋ผ ์ค‘์š” ์ •๋ณด ์ธํ”„๋ผ์˜ ์†Œ์Šค ์ฝ”๋“œ๋Š” ์™ธ๊ตญ ํด๋ผ์šฐ๋“œ ์„œ๋น„์Šค์—์„œ ์ฒ˜๋ฆฌ๋  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. Qwen3-Coder (Alibaba, Apache 2.0)๋Š” ์ค‘๊ตญ ๊ธฐ์—…์˜ ์ฝ”๋”ฉ ์›Œํฌํ”Œ๋กœ์šฐ์— ์ž์—ฐ์Šค๋Ÿฌ์šด ์„ ํƒ์ž…๋‹ˆ๋‹ค โ€” ์ค‘๊ตญ ๊ฐœ๋ฐœ์‚ฌ, Apache 2.0 ๋ผ์ด์„ ์Šค, Ollama๋ฅผ ํ†ตํ•œ ์™„์ „ํ•œ ์˜จํ”„๋ ˆ๋ฏธ์Šค ๋ฐฐํฌ. 2026๋…„ 6์›” ๊ธฐ์ค€, Qwen3-Coder 32B๋Š” ๋กœ์ปฌ์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ๊ฐ€์žฅ ๋†’์€ ์ ์ˆ˜์˜ ์ฝ”๋”ฉ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ์˜ ํ”ํ•œ ์‹ค์ˆ˜๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

  • ๋ชจ๋ธ ์„ ํƒ ์‹œ HumanEval๋งŒ์„ ์œ ์ผํ•œ ๋ฒค์น˜๋งˆํฌ๋กœ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ: HumanEval์€ ๋‹จ์ผ ํ•จ์ˆ˜ Python ์ƒ์„ฑ์„ ํ…Œ์ŠคํŠธํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ ๊ฐœ๋ฐœ์—์„œ๋Š” ๋ฉ€ํ‹ฐํŒŒ์ผ ์ถ”๋ก , ํ…Œ์ŠคํŠธ ์ƒ์„ฑ, ์ฝ”๋“œ๋ฒ ์ด์Šค ์ดํ•ด๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. SWE-bench๊ฐ€ ์‹ค์ œ ์ฝ”๋”ฉ ์„ฑ๋Šฅ์„ ๋” ์ž˜ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค. HumanEval 72%์ด์ง€๋งŒ SWE-bench 77% (Qwen 3.6)์ธ ๋ชจ๋ธ์ด HumanEval 87%์ด์ง€๋งŒ SWE-bench ๋ฏธํ…Œ์ŠคํŠธ์ธ ๋ชจ๋ธ์„ ์‹ค์šฉ์  ์›Œํฌํ”Œ๋กœ์šฐ์—์„œ ๋Šฅ๊ฐ€ํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค.
  • ์ด ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ๋„ˆ๋ฌด ์ปค ๋ณด์ธ๋‹ค๊ณ  MoE ๋ชจ๋ธ์„ ๋ฌด์‹œํ•˜๋Š” ๊ฒƒ: Kimi K2.6๋Š” ์ด 1T ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ–์ง€๋งŒ ํ† ํฐ๋‹น 32B๋งŒ ํ™œ์„ฑํ™”๋ฉ๋‹ˆ๋‹ค. MoE ๋ชจ๋ธ์€ ์ด ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ์‹œ์‚ฌํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ๋น ๋ฅด๊ณ  VRAM์„ ์ ๊ฒŒ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. 1T MoE ๋ชจ๋ธ์€ ๋ฐ€์ง‘ํ˜• 70B ๋ชจ๋ธ์ด ํ•„์š”๋กœ ํ•˜๋Š” ํ•˜๋“œ์›จ์–ด์—์„œ ์‹คํ–‰๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ฝ”๋“œ ํŠนํ™” ๋ชจ๋ธ ๋Œ€์‹  ๋ฒ”์šฉ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ: Qwen3 8B (์ฝ”๋”ฉ ํŠนํ™”)๋Š” ์œ ์‚ฌํ•œ HumanEval ์ ์ˆ˜์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์‹ค์ œ ์ž‘์—…์—์„œ Llama 3.3 8B ์ผ๋ฐ˜ (๋ฒ”์šฉ)๋ณด๋‹ค ์„ฑ๋Šฅ์ด ๋›ฐ์–ด๋‚ฉ๋‹ˆ๋‹ค. IDE ์ž๋™ ์™„์„ฑ์—๋Š” ํ•ญ์ƒ FIM ์ง€์›์ด ์žˆ๋Š” ์ฝ”๋“œ ํŠนํ™” ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • ๋ฉ€ํ‹ฐํŒŒ์ผ ๋ฆฌ๋ทฐ ์‹œ ์ปจํ…์ŠคํŠธ ๊ธธ์ด๋ฅผ ์„ค์ •ํ•˜์ง€ ์•Š๋Š” ๊ฒƒ: Ollama์˜ ๊ธฐ๋ณธ๊ฐ’์€ 2048 ํ† ํฐ์ž…๋‹ˆ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ์ฝ”๋“œ ํŒŒ์ผ์€ 1,000โ€“3,000 ํ† ํฐ์ž…๋‹ˆ๋‹ค. ์ „์ฒด ํŒŒ์ผ์ด๋‚˜ ์—ฌ๋Ÿฌ ํ•จ์ˆ˜๊ฐ€ ํฌํ•จ๋œ ์ฝ”๋”ฉ ์ž‘์—…์—๋Š” Modelfile์—์„œ `PARAMETER num_ctx 32768`์„ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค.
  • RAM์„ ์ ˆ์•ฝํ•˜๊ธฐ ์œ„ํ•ด ์ฝ”๋”ฉ ๋ชจ๋ธ์— Q3_K_S๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ: Q4_K_M ๋ฏธ๋งŒ์˜ ์–‘์žํ™”๋Š” ์ฝ”๋“œ ์ƒ์„ฑ ์ •ํ™•๋„๋ฅผ ๋ˆˆ์— ๋„๊ฒŒ ์ €ํ•˜์‹œํ‚ต๋‹ˆ๋‹ค โ€” ๋…ผ๋ฆฌ์  ์˜ค๋ฅ˜์™€ ๊ตฌ๋ฌธ ์‹ค์ˆ˜๊ฐ€ ์ฆ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋”ฉ ์ž‘์—…์—๋Š” ์ตœ์†Œ Q4_K_M์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. RAM์ด ๋ถ€์กฑํ•˜๋‹ค๋ฉด Q3_K_S์˜ ๋Œ€ํ˜• ๋ชจ๋ธ๋ณด๋‹ค Q4_K_M์˜ ์†Œํ˜• ๋ชจ๋ธ์„ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.
  • ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์ด ๋ชจ๋ธ์— ๊ด€๊ณ„์—†์ด ์ถœ๋ ฅ ํ’ˆ์งˆ์„ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค: ์–ธ์–ด, ์ œ์•ฝ ์กฐ๊ฑด, ํ…Œ์ŠคํŠธ ์ผ€์ด์Šค, ์˜ค๋ฅ˜ ์ฒ˜๋ฆฌ๋ฅผ ํ”„๋กฌํ”„ํŠธ์— ๋ช…ํ™•ํžˆ ์ง€์ •ํ•˜๋ฉด ํ™˜๊ฐ๋œ ์ฝ”๋“œ๊ฐ€ ํฌ๊ฒŒ ์ค„์–ด๋“ญ๋‹ˆ๋‹ค. ์‹ค์ œ ๊ฒ€์ฆ๋œ ํŒจํ„ด์— ๋Œ€ํ•ด์„œ๋Š” AI๋กœ ๋” ๋‚˜์€ ์ฝ”๋“œ ์ž‘์„ฑํ•˜๊ธฐ๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

โš ๏ธWarning: ์ฝ”๋”ฉ ๋ชจ๋ธ์— Q4_K_M ๋ฏธ๋งŒ์˜ ์–‘์žํ™”๋ฅผ ์ ˆ๋Œ€ ์‚ฌ์šฉํ•˜์ง€ ๋งˆ์‹ญ์‹œ์˜ค. Q3_K_S๋Š” RAM์„ ์ ˆ์•ฝํ•˜์ง€๋งŒ ๊ตฌ๋ฌธ ์˜ค๋ฅ˜์™€ ๋…ผ๋ฆฌ์  ๋ฒ„๊ทธ๋ฅผ ๋ฐœ์ƒ์‹œํ‚ต๋‹ˆ๋‹ค. ์ด๊ฒƒ์€ ์ฝ”๋“œ ์ƒ์„ฑ์— ๊ฐ€์น˜ ์žˆ๋Š” ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๊ฐ€ ์•„๋‹™๋‹ˆ๋‹ค โ€” Q4_K_M์„ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ์ „์ฒด ์ •๋ฐ€๋„์˜ ์†Œํ˜• ๋ชจ๋ธ์„ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.

FAQ

2026๋…„ 6์›” ๊ธฐ์ค€ ์ฝ”๋”ฉ์— ๊ฐ€์žฅ ์ ํ•ฉํ•œ ๋กœ์ปฌ LLM์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Kimi K2.6 โ€” SWE-Bench Pro 58.6์  (MoE, Modified MIT ๋ผ์ด์„ ์Šค). ์ตœ๊ณ ์˜ ๋ฐ€์ง‘ํ˜• ๋ชจ๋ธ: Qwen 3.6 27B โ€” SWE-bench 77.2%, VRAM 22 GB. 8 GB ํ™˜๊ฒฝ: Qwen3 8B. IDE ์ž๋™ ์™„์„ฑ: Codestral 22B.

HumanEval์ด๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์™œ ์ค‘์š”ํ•ฉ๋‹ˆ๊นŒ?

HumanEval์€ 164๊ฐœ์˜ Python ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๋ฌธ์ œ ๋ฒค์น˜๋งˆํฌ์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์€ ๊ฐ ๋ฌธ์ œ์— ๋Œ€ํ•œ ์˜ฌ๋ฐ”๋ฅธ ํ•จ์ˆ˜ ๋ณธ๋ฌธ์„ ์ƒ์„ฑํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ฒซ ๋ฒˆ์งธ ์‹œ๋„์—์„œ ํ•ด๊ฒฐํ•œ ๋น„์œจ(Pass@1)์ด ํ‘œ์ค€ ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค. ์ฝ”๋”ฉ ๋ชจ๋ธ ๋น„๊ต์— ๊ฐ€์žฅ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ์ฒ™๋„์ž…๋‹ˆ๋‹ค.

FIM(fill-in-the-middle)์ด๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์–ด๋–ค ๋ชจ๋ธ์ด ์ง€์›ํ•ฉ๋‹ˆ๊นŒ?

FIM์€ ์ปค์„œ ์•ž๋’ค์˜ ์ฝ”๋“œ๋ฅผ ๋ชจ๋‘ ๊ณ ๋ คํ•˜์—ฌ ์ฝ”๋“œ๋ฅผ ์™„์„ฑํ•˜๋Š” ๊ธฐ๋Šฅ์œผ๋กœ, IDE ์ž๋™ ์™„์„ฑ์— ์‚ฌ์šฉ๋˜๋Š” ํŒจํ„ด์ž…๋‹ˆ๋‹ค. Qwen3-Coder, DeepSeek-Coder, Starcoder2๋Š” ๋ชจ๋‘ FIM์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. Llama 3.3 8B ์ผ๋ฐ˜ ๋ชจ๋ธ์€ ์ง€์›ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. IDE ํ†ตํ•ฉ์—๋Š” FIM ์ง€์› ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ์ด GitHub Copilot์„ ๋Œ€์ฒดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

Continue.dev๋ฅผ ํ†ตํ•œ Codestral 22B๋Š” ์ด์ œ ๋Œ€๋ถ€๋ถ„์˜ ์ž๋™ ์™„์„ฑ ์ž‘์—…์—์„œ Copilot์— ๊ทผ์ ‘ํ•ฉ๋‹ˆ๋‹ค. ๋ณต์žกํ•œ ๋ฉ€ํ‹ฐํŒŒ์ผ ์ถ”๋ก ์—์„œ๋Š” ํด๋ผ์šฐ๋“œ ๋ชจ๋ธ์ด ๊ฐ€์žฅ ์–ด๋ ค์šด 20%์—์„œ ์—ฌ์ „ํžˆ ์šฐ์œ„๋ฅผ ๋ณด์ž…๋‹ˆ๋‹ค. ํŠธ๋ ˆ์ด๋“œ์˜คํ”„: Codestral์€ ๋” ๋А๋ฆฌ์ง€๋งŒ ์™„์ „ํžˆ ๋น„๊ณต๊ฐœ์ด๋ฉฐ ๋กœ์ปฌ์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ ์ฝ”๋”ฉ LLM์— ์–ผ๋งˆ๋‚˜ ๋งŽ์€ RAM์ด ํ•„์š”ํ•ฉ๋‹ˆ๊นŒ?

์ตœ์†Œ 4 GB (์†Œํ˜• 3B ๋ชจ๋ธ), ์‹ค์šฉ์ ์œผ๋กœ๋Š” 8 GB ์ด์ƒ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๊ถŒ์žฅ: 7Bโ€“16B ๋ชจ๋ธ์— ์—ฌ์œ  ๊ณต๊ฐ„์„ ๋‘๊ณ  16 GB. ๊ณ ์„ฑ๋Šฅ: 32B ๋ชจ๋ธ์— 32 GB ์ด์ƒ. ๊ณต์‹ ์‚ฌ์šฉ: ๋ชจ๋ธ ํฌ๊ธฐ(GB) โ‰ˆ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜ รท 4 (์˜ˆ: 7B รท 4 โ‰ˆ FP16์—์„œ 1.75 GB, Q4_K_M์—์„œ ์•ฝ 4.7 GB).

500์ค„ Python ํŒŒ์ผ์ด ์–ผ๋งˆ๋‚˜ ๋งŽ์€ ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๊นŒ?

500์ค„ Python ํŒŒ์ผ์€ ์•ฝ 2,000โ€“3,000 ํ† ํฐ์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. Ollama์˜ ๊ธฐ๋ณธ 2048 ํ† ํฐ ์ปจํ…์ŠคํŠธ๋Š” ๋ถ€์กฑํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ผ ํŒŒ์ผ ์ฝ”๋“œ ๋ฆฌ๋ทฐ์—๋Š” ์ตœ์†Œ `PARAMETER num_ctx 16384`๋ฅผ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค. ๋ฉ€ํ‹ฐํŒŒ์ผ ๋ถ„์„์—๋Š” 32768 ๋˜๋Š” 65536 ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ์ด ๊ฐœ๋ฐœ์— ์ถฉ๋ถ„ํžˆ ๋น ๋ฆ…๋‹ˆ๊นŒ?

๋ฐ˜๋ณต์ ์ธ ์›Œํฌํ”Œ๋กœ์šฐ(10โ€“50 ํ† ํฐ/์ดˆ)์—๋Š” ์ถฉ๋ถ„ํ•ฉ๋‹ˆ๋‹ค. Qwen3 8B๋Š” ๋…ธํŠธ๋ถ์—์„œ 20โ€“35 ํ† ํฐ/์ดˆ๋กœ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค โ€” ์ผ๊ด„ ์ƒ์„ฑ ์‹œ ์‘๋‹ต๋‹น 5โ€“10์ดˆ ๊ธฐ๋‹ค๋ฆฌ๋Š” ๊ฒƒ์€ ํ—ˆ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ์‹ค์‹œ๊ฐ„ ์ž๋™ ์™„์„ฑ(<1์ดˆ ํ•„์š”)์—๋Š” ์ ํ•ฉํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. IDE ์‚ฌ์šฉ ์‹œ ๋กœ์ปฌ ๋ชจ๋ธ์€ ์š”์ฒญ-๊ฒ€ํ†  ๋ฐฉ์‹์—๋Š” ์ ํ•ฉํ•˜์ง€๋งŒ ํ‚ค์ŠคํŠธ๋กœํฌ ์ž๋™ ์™„์„ฑ์—๋Š” ์ ํ•ฉํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM์ด ์ฝ”๋”ฉ์—์„œ GPT-5.5๋ฅผ ๋Œ€์ฒดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์•„๋‹ˆ์˜ค. ๋กœ์ปฌ ๋ชจ๋ธ(Kimi K2.6 SWE-Bench Pro 58.6์ , Qwen 3.6 27B SWE-bench 77.2%)์€ ๋‹ค์Œ์—์„œ ๋’ค์ฒ˜์ง‘๋‹ˆ๋‹ค: ์ตœ์‹  ํ”„๋ ˆ์ž„์›Œํฌ ์ง€์‹ (ํ•™์Šต ๋งˆ๊ฐ์ผ ์ดํ›„ API), ๋Œ€ํ˜• ์ฝ”๋“œ๋ฒ ์ด์Šค ๋ณต์žกํ•œ ๋ฉ€ํ‹ฐํŒŒ์ผ ์ถ”๋ก  (100k+ ํ† ํฐ), ๋””๋ฒ„๊น… ์ •ํ™•๋„. ๊ทธ๋Ÿฌ๋‚˜ Kimi K2.6์™€ Qwen 3.6๋Š” ๋ฉ€ํ‹ฐํŒŒ์ผ ์ฝ”๋”ฉ ์ž‘์—…์—์„œ ๊ฒฉ์ฐจ๋ฅผ ํฌ๊ฒŒ ์ขํ˜”์Šต๋‹ˆ๋‹ค.

Qwen3-Coder๊ฐ€ ๊ฐ€์žฅ ์ž˜ ์ง€์›ํ•˜๋Š” ์–ธ์–ด๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Python์ด ์ฃผ์š” ํ•™์Šต ์–ธ์–ด์ž…๋‹ˆ๋‹ค. JavaScript, TypeScript, Java, C++, Go, Rust, SQL๋„ ์ž˜ ์ง€์›๋ฉ๋‹ˆ๋‹ค. PHP, Ruby, Swift, Kotlin๋„ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ๋น„Python ์–ธ์–ด์˜ ๊ฒฝ์šฐ HumanEval ์ ์ˆ˜๋Š” ๋‚ฎ์ง€๋งŒ ์—ฌ์ „ํžˆ ๊ฒฝ์Ÿ๋ ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

DeepSeek-Coder๊ฐ€ ๋…์  ์ฝ”๋“œ์— ์•ˆ์ „ํ•˜๊ฒŒ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

Ollama๋ฅผ ํ†ตํ•ด ๋กœ์ปฌ์—์„œ ์‹คํ–‰ ์‹œ DeepSeek-Coder๋Š” ์™ธ๋ถ€ ์—ฐ๊ฒฐ์„ ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์ฝ”๋“œ๊ฐ€ ํ•˜๋“œ์›จ์–ด์— ๋‚จ์Šต๋‹ˆ๋‹ค. DeepSeek์— ๋Œ€ํ•œ ๋ฐ์ดํ„ฐ ์šฐ๋ ค๋Š” ํด๋ผ์šฐ๋“œ API(api.deepseek.com)์— ํ•ด๋‹นํ•˜๋ฉฐ, ๋กœ์ปฌ Ollama ์ถ”๋ก ์—๋Š” ์ ์šฉ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋กœ์ปฌ ์ถ”๋ก ์€ ์™„์ „ํžˆ ๋น„๊ณต๊ฐœ์ž…๋‹ˆ๋‹ค.

Qwen3-Coder์™€ Qwen3์˜ ์ฐจ์ด์ ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Qwen3-Coder๋Š” ์ฝ”๋“œ ๋ฐ์ดํ„ฐ๋กœ ๋ฏธ์„ธ ์กฐ์ •๋˜์–ด FIM ์ง€์›์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. Qwen3๋Š” ๋ฒ”์šฉ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. HumanEval์—์„œ Qwen3 8B์™€ Qwen3 7B๋Š” ์œ ์‚ฌํ•˜๊ฒŒ (72%) ์ ์ˆ˜๋ฅผ ๊ธฐ๋กํ•˜์ง€๋งŒ, Qwen3-Coder์—๋Š” ๋ฒ”์šฉ ๋ชจ๋ธ์— ์—†๋Š” ์ฝ”๋“œ ์™„์„ฑ ๊ธฐ๋Šฅ์ด ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ์„ SQL ์ƒ์„ฑ์— ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์˜ˆ โ€” Qwen 3.6 27B์™€ Kimi K2.6 ๋ชจ๋‘ SQL ์ƒ์„ฑ ์ž‘์—…์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค. ํ”„๋กฌํ”„ํŠธ ์ปจํ…์ŠคํŠธ์— ํ…Œ์ด๋ธ” ์Šคํ‚ค๋งˆ๋ฅผ ํฌํ•จํ•˜์‹ญ์‹œ์˜ค. ๋ณต์žกํ•œ ๋ฉ€ํ‹ฐ์กฐ์ธ ์ฟผ๋ฆฌ์—๋Š” ์ „์ฒด ์Šคํ‚ค๋งˆ๋ฅผ ํฌํ•จํ•˜๊ธฐ ์œ„ํ•ด 32K ์ปจํ…์ŠคํŠธ๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค: "๋‹น์‹ ์€ ์ „๋ฌธ SQL ๊ฐœ๋ฐœ์ž์ž…๋‹ˆ๋‹ค. ์œ ํšจํ•œ SQL๋งŒ ์ƒ์„ฑํ•˜์‹ญ์‹œ์˜ค."

SWE-bench๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์™œ HumanEval์„ ๋Œ€์ฒดํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๊นŒ?

SWE-bench๋Š” ์‹ค์ œ GitHub ์ด์Šˆ ํ•ด๊ฒฐ ๋Šฅ๋ ฅ, ์ฆ‰ ์ฝ”๋“œ๋ฒ ์ด์Šค ์ฝ๊ธฐ, ๋ฉ€ํ‹ฐํŒŒ์ผ ๋ณ€๊ฒฝ, ํ…Œ์ŠคํŠธ ์ž‘์„ฑ์„ ํ…Œ์ŠคํŠธํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์ผ Python ํ•จ์ˆ˜๋ฅผ ํ…Œ์ŠคํŠธํ•˜๋Š” HumanEval๊ณผ ๋‹ฌ๋ฆฌ, SWE-bench๋Š” ์‹ค์ œ ๊ฐœ๋ฐœ ์›Œํฌํ”Œ๋กœ์šฐ์—์„œ์˜ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ์˜ˆ์ธกํ•ฉ๋‹ˆ๋‹ค. Qwen 3.6 27B๋Š” SWE-bench์—์„œ 77.2%๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค. 2026๋…„์—๋Š” SWE-bench๊ฐ€ ์‹ค์ œ ์‚ฌ์šฉ์„ ์œ„ํ•œ ์ฝ”๋”ฉ ๋ชจ๋ธ ํ‰๊ฐ€์˜ 1์ฐจ ๋ฒค์น˜๋งˆํฌ์ž…๋‹ˆ๋‹ค.

Kimi K2.6๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์‚ฌ์šฉํ•ด๋„ ์•ˆ์ „ํ•ฉ๋‹ˆ๊นŒ?

Kimi K2.6๋Š” Modified MIT ๋ผ์ด์„ ์Šค๋กœ ์ถœ์‹œ๋œ Moonshot AI (์ค‘๊ตญ)์˜ ์˜คํ”ˆ์†Œ์Šค ์ฝ”๋”ฉ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. MoE ์•„ํ‚คํ…์ฒ˜ (32B ํ™œ์„ฑ / 1T ์ „์ฒด ํŒŒ๋ผ๋ฏธํ„ฐ)๋ฅผ ์‚ฌ์šฉํ•˜๋ฉฐ SWE-Bench Pro์—์„œ 58.6์ ์„ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค. Ollama๋ฅผ ํ†ตํ•ด ๋กœ์ปฌ์—์„œ ์‹คํ–‰ ์‹œ ๋ฐ์ดํ„ฐ๊ฐ€ ์™ธ๋ถ€๋กœ ์ „์†ก๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค โ€” ๋ชจ๋ธ์˜ ์ถœ์‹ ์ง€์— ๊ด€๊ณ„์—†์ด ์ฝ”๋“œ๊ฐ€ ์‹œ์Šคํ…œ์— ๋‚จ์Šต๋‹ˆ๋‹ค. Modified MIT ๋ผ์ด์„ ์Šค๋Š” ์ƒ์—…์  ์ด์šฉ์„ ํ—ˆ์šฉํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ์„ VS Code์— ์—ฐ๊ฒฐํ•˜๋ ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•ฉ๋‹ˆ๊นŒ?

VS Code ๋งˆ์ผ“ํ”Œ๋ ˆ์ด์Šค์—์„œ Continue.dev ํ™•์žฅ ํ”„๋กœ๊ทธ๋žจ์„ ์„ค์น˜ํ•˜์‹ญ์‹œ์˜ค. Continue ์„ค์ •์—์„œ Ollama๋ฅผ ์ œ๊ณต์ž๋กœ ์„ ํƒํ•˜๊ณ  ๋ชจ๋ธ์„ ์ง€์ •ํ•˜์‹ญ์‹œ์˜ค(์˜ˆ: `qwen3:8b`, `qwen3.6:27b`, `codestral:22b`). ํ™•์žฅ ํ”„๋กœ๊ทธ๋žจ์ด localhost:11434์—์„œ Ollama์— ์ž๋™์œผ๋กœ ์—ฐ๊ฒฐ๋ฉ๋‹ˆ๋‹ค. ์ธ๋ผ์ธ ์ฝ”๋“œ ์ƒ์„ฑ์„ ํŠธ๋ฆฌ๊ฑฐํ•˜๋ ค๋ฉด Cmd+I (macOS) ๋˜๋Š” Ctrl+I (Windows)๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

์ถœ์ฒ˜

  • Moonshot AI. (2026). "Kimi K2.6" โ€” MoE ์•„ํ‚คํ…์ฒ˜, Modified MIT ๋ผ์ด์„ ์Šค, SWE-Bench Pro
  • Qwen Team. (2026). "Qwen 3.6 ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ" โ€” SWE-bench 77.2%, ๋ฐ€์ง‘ํ˜• ์•„ํ‚คํ…์ฒ˜
  • Mistral AI. (2026). "Devstral Small 24B" โ€” ์—์ด์ „ํŠธ ์ฝ”๋”ฉ ๋ชจ๋ธ
  • Mistral AI. (2025). "Codestral" โ€” FIM ์ตœ์ ํ™” ์ฝ”๋”ฉ ๋ชจ๋ธ
  • Qwen Team. (2025). "Qwen3-Coder ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ." https://arxiv.org/abs/2409.12186 โ€” ๋ชจ๋“  ํฌ๊ธฐ ๊ตฌ๊ฐ„์˜ Qwen3-Coder์— ๋Œ€ํ•œ HumanEval ๋ฐ MBPP ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ.
  • DeepSeek AI. (2024). "DeepSeek-Coder-V2 ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ." https://arxiv.org/abs/2406.11931 โ€” DeepSeek-Coder V2 Lite์˜ MoE ์•„ํ‚คํ…์ฒ˜ ๋ฐ ์ฝ”๋”ฉ ๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Run PromptQuorum with a local LLM, your own API keys, or both โ€” you pick the backend.

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

2026๋…„ ์ตœ๊ณ ์˜ ๋กœ์ปฌ ์ฝ”๋”ฉ LLM: Qwen vs DeepSeek vs Llama