Key Takeaways
- ์ ์ฒด ์ต๊ณ ์ฝ๋ฉ ๋ชจ๋ธ: Kimi K2.6 โ SWE-Bench Pro 58.6์ , MoE ์ํคํ ์ฒ (32B ํ์ฑ / 1T ์ ์ฒด), Modified MIT ๋ผ์ด์ ์ค. ์ต๊ณ ์ ๋ฐ์งํ ๋ชจ๋ธ: Qwen 3.6 27B โ SWE-bench 77.2%.
- 8 GB RAM ์ต์ : Qwen3 8B โ Qwen3 8B์์ ๊ฐ์ , VRAM 5 GB ์ฌ์ฉ.
- ์์ด์ ํธ ์ฝ๋ฉ ์ต์ (๋ฉํฐํ์ผ ํธ์ง, ๋๋ฒ๊น ): Devstral Small 24B โ ํด ์ฝ๋ง ๋ฐ ๋ค๋จ๊ณ ์ํฌํ๋ก์ฐ๋ฅผ ์ํด ํน๋ณํ ์ค๊ณ๋จ.
- IDE ์๋ ์์ฑ ์ต์ : Codestral 22B (Mistral AI) โ FIM ์ต์ ํ, ๊ถ์ฅ ๋ชจ๋ธ๋ก Starcoder2 ๋์ฒด.
- SWE-bench๊ฐ 2026๋ 1์ฐจ ๋ฒค์น๋งํฌ๋ก HumanEval ๋์ฒด โ ๋จ์ํ ๋จ์ผ ํจ์ Python ์์ฑ์ด ์๋ ์ค์ GitHub ์ด์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ํ๊ฐํฉ๋๋ค.
- AI ์ฝ๋ฉ ์ด์์คํดํธ ์ํฌํ๋ก์ฐ(VS Code, Cursor)์ ๋ํด์๋ ์ฝ๋ฉ ์ํฌํ๋ก์ฐ๋ฅผ ์ํ ๋ก์ปฌ LLM์ ์ฐธ์กฐํ์ญ์์ค.
๋น ๋ฅธ ์ฌ์ค โ ๋ก์ปฌ ์ฝ๋ฉ LLM ํ๋์ ๋ณด๊ธฐ (2026๋ 6์)
- ์ ์ฒด ์ต๊ณ (์ต๋ ํ์ง): Kimi K2.6 โ SWE-Bench Pro 58.6์ , MoE (32B ํ์ฑ), Modified MIT ๋ผ์ด์ ์ค. ์ผ๋ฐ ์๋น์ ํ๋์จ์ด์์ ์ฌ์ฉํ๋ ค๋ฉด ์์ํ ํ์.
- ์ต๊ณ ์ ๋ฐ์งํ ๋ชจ๋ธ: Qwen 3.6 27B โ SWE-bench 77.2%, 22 GB VRAM, MoE ์ค๋ฒํค๋ ์์.
- ์์ด์ ํธ ์ฝ๋ฉ ์ต์ : Devstral Small 24B โ ๋ฉํฐํ์ผ ํธ์ง, ๋๋ฒ๊น ์ํฌํ๋ก์ฐ, 16 GB RAM, Mistral AI (ํ๋์ค).
- IDE ์๋ ์์ฑ ์ต์ : Codestral 22B (Mistral) โ FIM ์ต์ ํ, Continue.dev ํตํฉ, ์ฝ 14 GB RAM.
- 8 GB RAM ์ต์ : Qwen3 8B โ Qwen3 8B์์ ๊ฐ์ , VRAM 5 GB ์ฌ์ฉ, ์ต๊ณ ์ ํ์ง-์๋ ๊ท ํ.
- ๋ฒค์น๋งํฌ ๋ณํ: SWE-bench(์ค์ GitHub ์ด์)๊ฐ ์ค์ฉ์ ์ฝ๋ฉ์ 1์ฐจ ์งํ๋ก ์๋ฆฌ ์ก์์ต๋๋ค. HumanEval(๋จ์ผ Python ํจ์)์ ์ฌ์ ํ ๋น๊ต์ ์ ์ฉํฉ๋๋ค.
- ๊ถ์ฅ ์ฌ์: 16 GB RAM ์ด์ (Qwen 3.6 27B ๋๋ Devstral Small ์คํ ๊ฐ๋ฅ).
- ๊ณ ์ฑ๋ฅ ์ฌ์: 20 GB ์ด์ (์์ํ๋ Kimi K2.6 ๋๋ ์ต๊ณ ํ์ง์ ์ํ Qwen3-Coder 32B ์คํ ๊ฐ๋ฅ).
๐ ์ฝ๋ฉ์ฉ ์ต๊ณ ๋ก์ปฌ LLM (2026๋ 6์ ๋น ๋ฅธ ์ ํ)
- ์ ์ฒด ์ต๊ณ : Kimi K2.6 (์์ํ) โ SWE-Bench Pro 58.6์ , MoE ์ํคํ ์ฒ, Modified MIT ๋ผ์ด์ ์ค. `ollama run kimi-k2.6`
- ์ต๊ณ ์ ๋ฐ์งํ ๋ชจ๋ธ: Qwen 3.6 27B โ SWE-bench 77.2%, ์ต๊ณ ์ ๋นMoE ์ต์ . `ollama run qwen3.6:27b`
- ์์ด์ ํธ ์ฝ๋ฉ ์ต์ : Devstral Small 24B โ ๋ฉํฐํ์ผ ํธ์ง, ๋๋ฒ๊น , 16 GB RAM. `ollama run devstral-small:24b`
- IDE ์๋ ์์ฑ ์ต์ : Codestral 22B โ Continue.dev์ ์ต์ ํ๋ FIM. `ollama run codestral:22b`
- 8 GB RAM ์ต์ : Qwen3 8B โ ํฅ์๋ ์ฝ๋ฉ ์ฑ๋ฅ, VRAM 5 GB. `ollama run qwen3:8b`
- ๐ ๋ชจ๋ฅด๊ฒ ๋ค๋ฉด: Qwen3 8B๋ฅผ ์ฌ์ฉํ์ญ์์ค โ ์ผ๋ฐ ์๋น์์ฉ ๋ ธํธ๋ถ(8โ16 GB)์์ ์ต๊ณ ์ ํ์ง-์๋ ๊ท ํ.
- ๐ 16 GB ์ด์์ ๊ฒฝ์ฐ: SWE-bench ์ฑ๋ฅ์ ์ํด Qwen 3.6 27B๋ก ์ ๊ทธ๋ ์ด๋ํ์ญ์์ค.
- ๐ IDE ์๋ ์์ฑ์ด ํ์ํ ๊ฒฝ์ฐ: Continue.dev์ ํจ๊ป Codestral 22B๋ฅผ ์ฌ์ฉํ์ญ์์ค.
- ๐ ์ต๋ ํ์ง (20 GB ์ด์): ์คํ๋ผ์ธ ๊ธฐ๋ฅ์ ์ํด ์์ํ๋ Kimi K2.6 ๋๋ Qwen3-Coder 32B๋ฅผ ์ฌ์ฉํ์ญ์์ค.
๐ ๏ธPractice: ๋จผ์ ํ๋์จ์ด์ ๋ง๋ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ ํํ์ญ์์ค. 8 GB์ ๊ฒฝ์ฐ Qwen3 8B๋ฅผ, 16 GB ์ด์์ ๊ฒฝ์ฐ Qwen 3.6 27B ๋๋ Devstral Small 24B๋ฅผ, 20 GB ์ด์์ ๊ฒฝ์ฐ ์ต๊ณ ์ ์ค์ ์ฑ๋ฅ์ ์ํด Kimi K2.6 (์์ํ)์ ์ฌ์ฉํ์ญ์์ค. ๋ฉ๋ชจ๋ฆฌ ๋ถ์กฑ์ผ๋ก ์คํ์ด ๋ถ๊ฐ๋ฅํ ๋ํ ๋ชจ๋ธ์ ๋ด๋ ค๋ฐ๋ ๋ฐ ์๊ฐ์ ๋ญ๋นํ์ง ๋ง์ญ์์ค.
ํ ๋ฌธ์ฅ์ผ๋ก
2026๋ 6์ ๊ธฐ์ค ์ต๊ณ ์ ๋ก์ปฌ ์ฝ๋ฉ ๋ชจ๋ธ์ ์ต๋ ํ์ง์ ์ํ Kimi K2.6(SWE-Bench Pro 58.6์ , MoE), ์ต๊ณ ์ ๋ฐ์งํ ๋ชจ๋ธ์ธ Qwen 3.6 27B(SWE-bench 77.2%), ๊ทธ๋ฆฌ๊ณ 8 GB RAM ํ๊ฒฝ์ ์ํ Qwen3 8B์ ๋๋ค.
์ฌ์ด ๋ง๋ก
์ฝ๋ฉ ๋ชจ๋ธ์ ๋ก์ปฌ์์ ์คํํ๋ค๋ ๊ฒ์ ๋ ธํธ๋ถ์ AI ์ฝ๋ฉ ์ด์์คํดํธ๋ฅผ ์ค์นํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ์ฝ๋๊ฐ ๋น๊ณต๊ฐ๋ก ์ ์ง๋๊ณ ์คํ๋ผ์ธ์์๋ ์๋ํ์ง๋ง, GitHub Copilot๊ณผ ๊ฐ์ ํด๋ผ์ฐ๋ API๋ณด๋ค ๋๋ฆฝ๋๋ค.
์ฝ๋ฉ์ ์ข์ ๋ก์ปฌ LLM์ ์กฐ๊ฑด์ ๋ฌด์์ ๋๊น?
2026๋ ์๋ SWE-bench๊ฐ ์ค์ฉ์ ์ฝ๋ฉ์ 1์ฐจ ๋ฒค์น๋งํฌ๋ก HumanEval์ ๋๋ถ๋ถ ๋์ฒดํ์ต๋๋ค. SWE-bench๋ ๋จ์ํ ํจ์ ์์ฑ์ด ์๋๋ผ ์ค์ GitHub ์ด์ ํด๊ฒฐ ๋ฅ๋ ฅ, ์ฆ ๋ฉํฐํ์ผ ๋ณ๊ฒฝ, ์ฝ๋๋ฒ ์ด์ค ์ดํด, ํ ์คํธ ์์ฑ์ ํ๊ฐํฉ๋๋ค. Qwen 3.6 27B๋ SWE-bench์์ 77.2%๋ฅผ, Kimi K2.6๋ SWE-Bench Pro์์ 58.6์ ์ ๊ธฐ๋กํ์ต๋๋ค.
์ฝ๋ ํนํ ๋ชจ๋ธ์ ๋๊ท๋ชจ ์ฝ๋ ๋ฐ์ดํฐ(GitHub, Stack Overflow, ๋ฌธ์)๋ก ๋ฏธ์ธ ์กฐ์ ๋๋ฉฐ, ์ข ์ข FIM(fill-in-the-middle) ํ๋ จ์ ํฌํจํฉ๋๋ค. FIM์ ์ปค์ ์๋ค์ ๋งฅ๋ฝ์ ๋ชจ๋ ํ์ฉํด ์ฝ๋๋ฅผ ์์ฑํ๋ ๊ธฐ๋ฅ์ผ๋ก IDE ์๋ ์์ฑ์ ํ์์ ์ ๋๋ค.
Llama 3.3 8B์ ๊ฐ์ ๋ฒ์ฉ ๋ชจ๋ธ์ HumanEval์์ 72%๋ฅผ ๊ธฐ๋กํด ๊ฒฝ์๋ ฅ์ด ์์ต๋๋ค. ๊ทธ๋ฌ๋ ๋์ผํ ํฌ๊ธฐ์ ์ฝ๋ ์ ์ฉ ๋ชจ๋ธ์ ํ๋ จ ๋ฐ์ดํฐ์ ๋ฏธ์ธ ์กฐ์ ์ด ์ฝ๋ ์์ฑ ์ ํ๋์ ์ง์ค๋์ด ์์ด 5โ15% ๋ ๋์ ์ ์๋ฅผ ๊ธฐ๋กํฉ๋๋ค.
๐Note: SWE-bench๋ 2026๋ ์ค์ ์ฝ๋ฉ์์ ๊ฐ์ฅ ๊ด๋ จ์ฑ ๋์ ๋ฒค์น๋งํฌ์ ๋๋ค. HumanEval์ ๋จ์ผ ํจ์ ์์ฑ ๋น๊ต์๋ ์ฌ์ ํ ์ ์ฉํ์ง๋ง, SWE-bench๊ฐ ๊ฐ๋ฐ ์ํฌํ๋ก์ฐ ์ฑ๋ฅ์ ๋ ์ ์์ธกํฉ๋๋ค.
#1 Kimi K2.6 โ ์ ์ฒด ์ต๊ณ ๋ก์ปฌ ์ฝ๋ฉ LLM
Kimi K2.6 (Moonshot AI)๋ 2026๋ 6์ ๊ธฐ์ค ๋ก์ปฌ์์ ์คํ ๊ฐ๋ฅํ ์ต๊ณ ์ฑ๋ฅ์ ์ฝ๋ฉ ๋ชจ๋ธ์ ๋๋ค. SWE-Bench Pro์์ 58.6์ ์ ๊ธฐ๋กํ๋ฉฐ Tier A์ ์ฒ์ ์ง์ ํ ๋น์๊ตฌ๊ถ ๋ชจ๋ธ์ ๋๋ค. ์ด 1T ํ๋ผ๋ฏธํฐ ์ค 32B๊ฐ ํ์ฑํ๋๋ MoE ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํฉ๋๋ค. Modified MIT ๋ผ์ด์ ์ค๋ก ์์ ์ ์ด์ฉ์ด ํ์ฉ๋ฉ๋๋ค.
`ollama run kimi-k2.6`์ผ๋ก ์คํ ๊ฐ๋ฅํฉ๋๋ค. ์ผ๋ฐ ์๋น์ ํ๋์จ์ด์์๋ ์์ํ๊ฐ ๊ถ์ฅ๋ฉ๋๋ค. ๋ฉํฐํ์ผ ํธ์ง, ์ธ์ ๊ธฐ๋ฐ ๋ฉํฐํด ์ฝ๋ฉ, API ์ฌ์ฉ ์ ํ๋์์ ๊ฐ์ ์ ๋ณด์ ๋๋ค. ๋ณต์กํ ๋ฆฌํฉํ ๋ง ๋ฐ ์๊ณ ๋ฆฌ์ฆ ์ค๊ณ ์์ ์์ ์ต์ฒจ๋จ ํด๋ผ์ฐ๋ ๋ชจ๋ธ์ ํ์ ํ๋ ํ์ง์ ์ ๊ณตํฉ๋๋ค.
| Spec | Value |
|---|---|
| SWE-Bench Pro ์ ์ | 58.6 (GPT-5.5์ ๋๋ฑ) |
| ์ํคํ ์ฒ | MoE (32B ํ์ฑ / 1T ์ ์ฒด) |
| ๋ผ์ด์ ์ค | Modified MIT (์์ ์ ์ด์ฉ ํ์ฉ) |
| ์ปจํ ์คํธ ์๋์ฐ | 128K ํ ํฐ |
| ์์ํ | ์ผ๋ฐ ์๋น์ ํ๋์จ์ด์ ๊ถ์ฅ |
| Ollama ๋ช ๋ น์ด | ollama run kimi-k2.6 |
๐Insight: Kimi K2.6์ MoE ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ํ ํฐ๋น ํ์ฑํ๋๋ ํ๋ผ๋ฏธํฐ๋ 1T๊ฐ ์๋ 32B์ ๋๋ค. ๋ฐ๋ผ์ ์ด ํ๋ผ๋ฏธํฐ ์๊ฐ ์์ฌํ๋ ๊ฒ๋ณด๋ค ๋น ๋ฅด๊ณ ํจ์จ์ ์ ๋๋ค. MoE ๋ชจ๋ธ์ ๋ฐ์งํ 70B ๋ชจ๋ธ์ด ํ์๋ก ํ๋ ํ๋์จ์ด์์ ์คํ๋ฉ๋๋ค.
#2 Qwen 3.6 27B โ ์ต๊ณ ์ ๋ฐ์งํ ์ฝ๋ฉ ๋ชจ๋ธ
Qwen 3.6 27B๋ SWE-bench 77.2%๋ฅผ ๊ธฐ๋กํ ์ต๊ณ ์ ๋ฐ์งํ(๋นMoE) ์ฝ๋ฉ ๋ชจ๋ธ์ ๋๋ค. MoE ๋ชจ๋ธ๊ณผ ๋ฌ๋ฆฌ ๋ชจ๋ ํ๋ผ๋ฏธํฐ๊ฐ ํ ํฐ๋น ํ์ฑํ๋๋ฏ๋ก ๋์์ด ๋ ์์ธก ๊ฐ๋ฅํ๊ณ ์ฅ๋ฌธ ๋งฅ๋ฝ ์ถ๋ก ์ ์ ๋ฆฌํฉ๋๋ค. 22 GB VRAM์ด ํ์ํฉ๋๋ค.
`ollama run qwen3.6:27b`๋ก ์คํํฉ๋๋ค. ์ฝ๋ ์์ฑ, ๋๋ฒ๊น , ๊ตฌ์กฐํ๋ ์ถ๋ ฅ์ ๊ฐํฉ๋๋ค. ๋ฉํฐํ์ผ ์ฝ๋ ๋ถ์ ๋ฐ ๋ฆฌํฉํ ๋ง์ ํ์ํฉ๋๋ค. 27B ํ๋ผ๋ฏธํฐ ์ ์ฒด๊ฐ ํ ํฐ๋น ํ์ฑํ๋์ด ๋ณต์กํ ์ฝ๋๋ฒ ์ด์ค ์ ๋ฐ์ ๊ฑธ์ณ ์ผ๊ด๋ ์ถ๋ก ์ ์ ๊ณตํฉ๋๋ค.
| Spec | Value |
|---|---|
| SWE-bench ์ ์ | 77.2% |
| ์ํคํ ์ฒ | ๋ฐ์งํ (27B ์ ์ฒด ํ์ฑ) |
| ํ์ RAM (Q4_K_M) | ~22 GB |
| ์ปจํ ์คํธ ์๋์ฐ | 128K ํ ํฐ |
| ์ ํฉํ ์ฉ๋ | ๋ฉํฐํ์ผ ์ถ๋ก , ๋ฆฌํฉํ ๋ง |
| Ollama ๋ช ๋ น์ด | ollama run qwen3.6:27b |
๐กTip: ๋ฐ์งํ ๋ชจ๋ธ(๋ชจ๋ ํ๋ผ๋ฏธํฐ ํ์ฑ)๊ณผ MoE ๋ชจ๋ธ(ํฌ์ ํ์ฑํ) ๋น๊ต: ๋ฐ์งํ ๋ชจ๋ธ์ ๊ธด ์ถ๋ก ์ฒด์ธ์์ ๋ ์์ธก ๊ฐ๋ฅํฉ๋๋ค. MoE๋ ๋ ๋น ๋ฅด์ง๋ง ํ ํฐ ๋ผ์ฐํ ๋ฐฉ์์ด ๋ค๋ฅผ ์ ์์ต๋๋ค. ๋ฉํฐํ์ผ ๋ถ์๊ณผ ์ฝ๋๋ฒ ์ด์ค ์ดํด์๋ ๋ฐ์งํ์ธ Qwen 3.6 27B๊ฐ ํ์ํฉ๋๋ค.
#3 Devstral Small 24B โ ์์ด์ ํธ ์ฝ๋ฉ์ ์ต์
Devstral Small 24B (Mistral AI)๋ ์์ด์ ํธ ์ฝ๋ฉ ์ํฌํ๋ก์ฐ, ์ฆ ๋ฉํฐํ์ผ ํธ์ง, ํด ์ฝ๋ง์ ํตํ ์ฝ๋ ์์ฑ, ๋๋ฒ๊น ๋ฃจํ๋ฅผ ์ํด ํน๋ณํ ์ค๊ณ๋ ๋ชจ๋ธ์ ๋๋ค. 16 GB RAM์ด ํ์ํฉ๋๋ค. `ollama run devstral-small:24b`๋ก ์คํํฉ๋๋ค.
aider, Claude Code ์คํ์ผ ์ํฌํ๋ก์ฐ, ๋ค๋จ๊ณ ์ฝ๋ ์์ ์ ์ฌ์ฉํ๋ ๊ฐ๋ฐ์์๊ฒ ์ต์ ์ ๋๋ค. ํ์ผ ์ ๋ฐ์ ์ฝ๋ ๋ณ๊ฒฝ์ ์ดํดํ๊ณ ์ค๋ฅ ํผ๋๋ฐฑ์ ๊ธฐ๋ฐํ ์์ ์ ์์ฑํ๋ ๋ฐ ํ์ํฉ๋๋ค. IDE ํตํฉ์ ์ํ ํด ์ฝ๋ง์ ์ง์ํฉ๋๋ค.
| Spec | Value |
|---|---|
| ์ ํฉํ ์ฉ๋ | ์์ด์ ํธ ์ํฌํ๋ก์ฐ, ๋ฉํฐํ์ผ ํธ์ง |
| ํ์ RAM (Q4_K_M) | ~16 GB |
| ์ปจํ ์คํธ ์๋์ฐ | 128K ํ ํฐ |
| ํด ์ฝ๋ง | ์ง์ |
| ๋ผ์ด์ ์ค | Mistral Apache 2.0 |
| Ollama ๋ช ๋ น์ด | ollama run devstral-small:24b |
๐Insight: ์์ด์ ํธ ์ฝ๋ฉ = ์ถ๋ก โ ์ฝ๋ ์์ฑ โ ์คํ โ ์ค๋ฅ ๊ด์ฐฐ โ ์์ โ ๋ฐ๋ณต. Devstral Small 24B๋ ์ด ๋ฃจํ์ ๋ฐ์ด๋ฉ๋๋ค. ์ ์ฌํ ํฌ๊ธฐ์ ๋ฒ์ฉ ๋ชจ๋ธ๋ณด๋ค ๋ฉํฐํ์ผ ๋งฅ๋ฝ๊ณผ ์ค๋ฅ ์์ ํผ๋๋ฐฑ์ ๋ ์ ์ฒ๋ฆฌํฉ๋๋ค.
#4 Codestral 22B โ IDE ์๋ ์์ฑ์ ์ต์
Codestral 22B (Mistral AI)๋ ๊ถ์ฅ FIM ๋ชจ๋ธ๋ก Starcoder2๋ฅผ ๋์ฒดํฉ๋๋ค. VS Code ๋ฐ Cursor์ Continue.dev์์ FIM(fill-in-the-middle) ์๋ ์์ฑ์ ์ํด ํน๋ณํ ์ค๊ณ๋์์ต๋๋ค. ๋๋ถ๋ถ์ ์๋ ์์ฑ ์์ ์์ Copilot์ ๋ฒ๊ธ๊ฐ๋ ํ์ง์ ์ ๊ณตํฉ๋๋ค.
`ollama run codestral:22b`๋ก ์คํํฉ๋๋ค. ์ปค์ ์์น ์๋ค์ ๋งฅ๋ฝ์ ํ์ฉํ๋ IDE ์คํ์ผ ์ฝ๋ ์์ฑ์ ์ต์ ํ๋์ด ์์ต๋๋ค. Python, JavaScript, TypeScript, Go, Rust์ ๊ฐํฉ๋๋ค.
์ ์ฅ์ ์ธ์ ์ฝ๋ ์์ฑ์๋ `ollama run qwen3-coder:30b`๊ฐ ๊ฐ์ฅ ๊ฐ๋ ฅํ ์คํ ์จ์ดํธ ๋์์ ๋๋ค (Apache 2.0). 16 GB ํ๊ฒฝ์์ ์ถ๋ก ๊ธฐ๋ฅ์ ๊ฐ์ถ ์ํ ์ฝ๋๊ฐ ํ์ํ๋ค๋ฉด `ollama run gpt-oss:20b` (OpenAI ์คํ ์จ์ดํธ, ์ ์ฒด 21B / ํ์ฑ 3.6B MoE, ์กฐ์ ๊ฐ๋ฅํ ์ถ๋ก )๋ ํ๋ฅญํ ์ ํ์ ๋๋ค.
| Spec | Value |
|---|---|
| ์ ํฉํ ์ฉ๋ | FIM (IDE ์๋ ์์ฑ) |
| ํ์ RAM (Q4_K_M) | ~14 GB |
| FIM ์ง์ | ์ง์ (์ฃผ์ ์ฌ์ฉ ์ฌ๋ก) |
| ๋ผ์ด์ ์ค | Mistral Apache 2.0 |
| IDE ํตํฉ | Continue.dev, Cursor |
| Ollama ๋ช ๋ น์ด | ollama run codestral:22b |
๐Insight: Mistral AI์ Codestral 22B๋ FIM(fill-in-the-middle) ์ฝ๋ ์์ฑ์ ์๋ก์ด ํ์ค์ ๋๋ค. ์๋ ์์ฑ ์ ํ๋์ IDE ํตํฉ์์ Starcoder2๋ฅผ ๋ฅ๊ฐํฉ๋๋ค. Continue.dev์ ๊ฒฐํฉํ๋ฉด GitHub Copilot์ ๋ก์ปฌ ๋์์ ์ ๊ณตํฉ๋๋ค.
#5 Qwen3 8B โ 8 GB RAM ํ๊ฒฝ ์ต๊ณ ์ ์ฝ๋ฉ ๋ชจ๋ธ
Qwen3 8B๋ 8 GB ํ๊ฒฝ์ ๊ถ์ฅ ๋ชจ๋ธ๋ก Qwen3 8B๋ฅผ ๋์ฒดํฉ๋๋ค. ํฅ์๋ ์ฝ๋ฉ ์ฑ๋ฅ, ๋ค๊ตญ์ด ์ง์, VRAM 5 GB๋ง ์ฌ์ฉํฉ๋๋ค. ๋ค๋ฅธ ์ฝ๋ฉ ๋ชจ๋ธ์ VRAM ์๊ตฌ์ฌํญ์ ๋ํ ์์ธํ ์๋ด๋ VRAM ์๊ตฌ์ฌํญ ๊ฐ์ด๋ โ๋ฅผ ์ฐธ์กฐํ์ญ์์ค. `ollama run qwen3:8b`๋ก ์คํํฉ๋๋ค. ์ ๋์ ์ธ ์ต์ ์ฌ์์ด ํ์ํ๋ค๋ฉด DeepSeek V4 Flash๊ฐ ์์ฐ ๋์์ด ๋ ์ ์์ต๋๋ค.
๐Insight: Qwen3 8B๋ Qwen3 8B์์ ๊ฐ์ ๋์์ต๋๋ค: ํฅ์๋ ๋ค๊ตญ์ด ์ง์, ๋ ๋น ๋ฅธ ์ถ๋ก , ์ค์ ์์ ์์ ํฅ์๋ ์ฝ๋ ํ์ง. 8 GB ํ๊ฒฝ์์๋ ํ์ฌ ์ด ๋ชจ๋ธ์ด ๊ถ์ฅ ์ถ๋ฐ์ ์ ๋๋ค.
์ฝ๋ฉ ๋ชจ๋ธ ๋น๊ต: HumanEval + SWE-bench (2026๋ 6์)
| Model | HumanEval | SWE-bench | RAM | FIM |
|---|---|---|---|---|
| Kimi K2.6 (MoE) | โ | 58.6 (SWE-Bench Pro) | ๋ค์ (์์ํ) | โ |
| Qwen 3.6 27B | โ | 77.2% | 22 GB | ์ง์ |
| Devstral Small 24B | โ | ๋์ (์์ด์ ํธ) | 16 GB | ์ง์ |
| Codestral 22B | โ | โ | 14 GB | ์ง์ (์ฃผ์) |
| Qwen3-Coder 32B | 87% | โ | 20 GB | ์ง์ |
| DeepSeek V4 Flash | โ | 78/100 (์ค์ ํ๊ฒฝ) | ~8 GB | ์ง์ |
| Qwen3 8B | ~76% | โ | 5 GB | ์ง์ |
| DeepSeek-R1 14B | โ | โ | 10 GB | ๋ฏธ์ง์ |
๐Note: HumanEval์ ๋จ์ผ ํจ์ Python ์์ฑ์ ์ธก์ ํฉ๋๋ค. SWE-bench๋ ์ค์ ๋ฉํฐํ์ผ ์ฝ๋ ๋ณ๊ฒฝ์ ์ธก์ ํฉ๋๋ค. '์ค์ ํ๊ฒฝ' ์ ์๋ ๋ ๋ฆฝ์ ์ธ ๋ฉํฐํ์คํฌ ์ฝ๋ฉ ๋ฒค์น๋งํฌ์์ ๋์จ ๊ฒ์ ๋๋ค. ๋ ์งํ ๋ชจ๋ ์ ์๋ฏธํ๋ฉฐ, SWE-bench๊ฐ ์ค์ ์ฝ๋ฉ ์ฑ๋ฅ์ ๋ ์ ์์ธกํฉ๋๋ค.
์ด ๋ชจ๋ธ๋ค์ ์ค์ ์ฝ๋ฉ ์์ ์์ ์ด๋ป๊ฒ ๋์ํฉ๋๊น?
- 1Python ํจ์ ๋๋ฒ๊น โ Kimi K2.6 (SWE-Bench Pro 58.6์ )์ ๋ฒ๊ทธ(์คํ๋ฐ์ด์ ๋ฃจํ ์กฐ๊ฑด)๋ฅผ 1โ2ํ์ ์๋ต์ผ๋ก ์ฐพ์๋ ๋๋ค. Qwen 3.6 27B (SWE-bench 77.2%)๋ 2โ3๋ฒ์ ์๋๋ก ํด๊ฒฐํฉ๋๋ค. Codestral 22B๋ ์ ํํ ๊ฐ์ง๋ฅผ ์ํด ์ฌํํ์ด ํ์ํฉ๋๋ค. ์น์: ๋๋ฒ๊น ์ ํ๋์ ์๋์์ Kimi K2.6.
- 2๋ฉํฐํ์ผ ์ฝ๋ ๋ฆฌํฉํ ๋ง โ Qwen 3.6 27B๋ 27B ํ๋ผ๋ฏธํฐ ์ ์ฒด๊ฐ ํ์ฑํ(๋ฐ์งํ ๋ชจ๋ธ)๋์ด ๋ฉํฐํ์ผ ๋ณ๊ฒฝ์ ํ์ํฉ๋๋ค. Kimi K2.6 (MoE)๋ ํ ํฐ๋ง๋ค ๋ค๋ฅด๊ฒ ๋ผ์ฐํ ๋์ง๋ง ๋ ๋น ๋ฅด๊ฒ ์ ์ฌํ ๊ฒฐ๊ณผ๋ฅผ ๋ ๋๋ค. Devstral Small 24B๋ ํด ์ฝ๋ง์ ํตํ ๋ฉํฐํ์ผ ์ํฌํ๋ก์ฐ๋ฅผ ์ํด ํน๋ณํ ์ค๊ณ๋์์ต๋๋ค. ์น์: ์ผ๊ด๋ ๋ฉํฐํ์ผ ์ถ๋ก ์์ Qwen 3.6 27B.
- 3FIM / IDE ์๋ ์์ฑ (VS Code) โ Codestral 22B์ Qwen3 8B (Continue.dev ๊ฒฝ์ ) ๋ชจ๋ ์ปค์ ์์ชฝ ๋งฅ๋ฝ์ ํ์ฉํด ๋ฉํฐ๋ผ์ธ ํจ์ ๋ณธ๋ฌธ์ ์ ํํ๊ฒ ์์ฑํฉ๋๋ค. Kimi K2.6๋ FIM์ ์ง์ํ์ง ์์ต๋๋ค(ํ๋ จ๋์ง ์์). ์น์: IDE ํตํฉ์์ Codestral 22B์ Qwen3 8B.
- 4TypeScript ํ์ ์ถ๋ก โ Kimi K2.6๋ ์ ๋์จ ํ์ ๊ณผ ์ ๋ค๋ฆญ ์ ์ฝ ์กฐ๊ฑด์ ์ฌ๋ฐ๋ฅด๊ฒ ์ถ๋ก ํฉ๋๋ค. Qwen 3.6 27B๋ ํ์ ์ถ๋ก ์์ ์์ 85% ์ด์์ ์ ํ๋๋ฅผ ๊ธฐ๋กํฉ๋๋ค. Qwen3 8B๋ ๋ณต์กํ ํ์ ์ ์ ํ๋กฌํํธ์ 15% ์ด์์์ ์คํจํฉ๋๋ค. ์น์: ๋ณต์กํ ํ์ ์์คํ ๊ณผ ๋ฉํฐํ์ผ ํ์ ์ถ์ ์์ Kimi K2.6.
๐Insight: ์ค์ ์ฝ๋ฉ ์์ (SWE-bench)์์๋ ๋ํ ๋ชจ๋ธ์ด ์ ๋ฆฌํฉ๋๋ค. Kimi K2.6 (SWE-Bench Pro 58.6์ )๊ณผ Qwen 3.6 27B (SWE-bench 77.2%)๋ ์ค์ฉ์ ์ธ ๋๋ฒ๊น ๊ณผ ๋ฆฌํฉํ ๋ง์์ Qwen3 8B๋ณด๋ค ์ฝ 5โ10% ๋ ๋์ ์ ์๋ฅผ ๊ธฐ๋กํฉ๋๋ค. ์ผ์์ ์ธ ์คํฌ๋ฆฝํ ์์๋ ๊ฒฉ์ฐจ๊ฐ ํฌ๊ฒ ์ขํ์ง๋๋ค.
์ด๋ค ์ฝ๋ฉ ๋ชจ๋ธ์ด ์๋์ ์ถ๋ ฅ ํ์ง์ ๊ท ํ์ ๊ฐ์ฅ ์ ๋ง์ถฅ๋๊น?
| Task | Kimi K2.6 | Qwen 3.6 27B | Qwen3 8B | Codestral 22B |
|---|---|---|---|---|
| REST API ์์ฑ (100์ค ๋ณด์ผ๋ฌํ๋ ์ดํธ) | 18โ32 tok/sec | โ ์ฌ๋ฐ๋ฅธ ๋ผ์ฐํธ + ์ค๋ฅ ์ฒ๋ฆฌ | 12โ18 tok/sec | โ ์ฌ๋ฐ๋ฅธ ๋ผ์ฐํธ | 30โ45 tok/sec | โ ๏ธ ์ ํจ์ฑ ๊ฒ์ฌ ๋๋ฝ | 28โ38 tok/sec | โ ๏ธ ์ผ๋ฐ์ ์ธ ์ถ๋ ฅ |
| SQL ์ฟผ๋ฆฌ ๋๋ฒ๊น (๋ณต์กํ JOIN) | 15โ25 tok/sec | โ ์ฌ๋ฐ๋ฅธ ์ธ๋ฑ์ค + ์ต์ ํ ํํธ | 12โ20 tok/sec | โ ์ฌ๋ฐ๋ฅธ ์ธ๋ฑ์ค | 20โ30 tok/sec | โ ๏ธ ๋ถ๋ถ์ ํด๊ฒฐ | 18โ28 tok/sec | โ ์๋ชป๋ ์ธ๋ฑ์ค |
| ๋จ์ ํ ์คํธ ์์ฑ (3โ5๊ฐ ํ ์คํธ ์ผ์ด์ค) | 16โ28 tok/sec | โ ์ฃ์ง ์ผ์ด์ค + ๋ณด์ ์ปค๋ฒ๋ฆฌ์ง | 14โ22 tok/sec | โ ์ํธํ ์ปค๋ฒ๋ฆฌ์ง | 28โ40 tok/sec | โ ๏ธ ์ ์ ๊ฒฝ๋ก๋ง | 25โ35 tok/sec | โ ๏ธ ์ ์ ๊ฒฝ๋ก๋ง |
| FIM ์๋ ์์ฑ (์ปค์ ์ค๊ฐ) | N/A (FIM ๋ฏธ์ง์) | N/A (์ต์ ํ ์๋จ) | 50+ tok/sec | โ ์ ํ (FIM) | 60+ tok/sec | โ ๊ฐ์ฅ ๋น ๋ฅด๊ณ ์ ํํ FIM |
๐กTip: ํต์ฌ ์ธ์ฌ์ดํธ: Kimi K2.6์ Qwen 3.6 27B๋ ์ถ๋ก ์์ (๋๋ฒ๊น , SQL ์ต์ ํ, ๋ณด์)์์ ๋ ๋๋ฆฌ์ง๋ง ์ ํํฉ๋๋ค. Qwen3 8B๋ ์์ฑ ์์ (API ๋ณด์ผ๋ฌํ๋ ์ดํธ, ํ ์คํธ ์ค์บํด๋ฉ)์์ ๋ ๋น ๋ฆ ๋๋ค. IDE ์๋ ์์ฑ์๋ FIM ์ต์ ํ ๋ชจ๋ธ(Codestral 22B, Qwen3 8B)๋ง ์ฌ์ฉํ์ญ์์ค.
๐ ๏ธPractice: ์ค์ฉ์ ์ธ ๊ถ์ฅ ์ฌํญ: ์์ ์ ํ์ ๋ฐ๋ผ ์ ํํ์ญ์์ค. ์ผ๊ด ์ฝ๋ ์์ฑ์ด๋ ๋ฆฌํฉํ ๋ง ๊ฒํ ์๋ Qwen3-Coder 32B(๋์ ํ์ง, ํ์ฉ ๊ฐ๋ฅํ ์ง์ฐ)๋ฅผ ์ฌ์ฉํ์ญ์์ค. ์ค์๊ฐ IDE ์๋ ์์ฑ์๋ Codestral 22B ๋๋ Qwen3 8B(์๋ ์ต์ฐ์ )๋ฅผ ์ฌ์ฉํ์ญ์์ค. 16 GB ํ๊ฒฝ์์๋ DeepSeek-Coder V2 Lite๋ก ๊ท ํ์ ๋ง์ถ์ญ์์ค.
์ด๋ค ๋ก์ปฌ ์ฝ๋ฉ LLM์ ์ฌ์ฉํด์ผ ํฉ๋๊น?
์ ํํ๋ ๋ชจ๋ธ๋ ์ค์ํ์ง๋ง, ์ฝ๋ ํ์ง์ ์ํด์๋ ํ๋กฌํํธ ์์ฑ ๋ฐฉ์์ด ๋ ์ค์ํฉ๋๋ค. ์ธ์ด, ์ ์ฝ ์กฐ๊ฑด, ํ ์คํธ ์ผ์ด์ค, ์ถ๋ ฅ ํ์์ ๋ช ํํ ์ง์ ํ๋ ๊ตฌ์กฐํ๋ ํ๋กฌํํ ๊ธฐ๋ฒ์ ์ฝ๋ ์์ฑ ์ ํ๋๋ฅผ ํฌ๊ฒ ํฅ์์ํต๋๋ค. ํ๋กฌํํธ ์์ง๋์ด๋ง ๊ฐ์ด๋์์๋ ๊ธฐ์ด, ํ๋ ์์ํฌ, ํ๊ฐ ๋ฐฉ๋ฒ์ ๊ฑธ์น 80๊ฐ์ง ๊ธฐ๋ฒ์ ๋ค๋ฃน๋๋ค.
์ด ๋ชจ๋ธ๋ค์ ์ค์ฌ์ผ๋ก ๊ตฌ์ฑ๋ ์์ ํ IDE ์ํฌํ๋ก์ฐ์ ๋ํด์๋ GitHub Copilot์ ๋ก์ปฌ LLM์ผ๋ก ๊ต์ฒดํ๊ธฐ๋ฅผ ์ฐธ์กฐํ์ญ์์ค. ์์ ์ ํ ๋ชจ๋ธ๊ณผ ์ ์ด์ธ๋ฆฌ๋ ์คํ์์ค ์คํ(Continue.dev + Ollama + Qwen3-Coder)์ ๋๋ค.
- 8 GB RAM, ์ฝ๋ฉ ์ง์ค: `ollama run qwen3:8b` โ VRAM 5 GB ์ฌ์ฉ, ์ด ๊ตฌ๊ฐ ์ต๊ณ ๋ชจ๋ธ.
- 16 GB RAM: `ollama run devstral-small:24b` โ ์์ด์ ํธ ์ฝ๋ฉ์ ์ต์ (๋ฉํฐํ์ผ ํธ์ง, ๋๋ฒ๊น ๋ฃจํ), 16 GB VRAM.
- 20 GB ์ด์ RAM (์ต๊ณ ํ์ง): `ollama run kimi-k2.6` (์์ํ) ๋๋ `ollama run qwen3.6:27b` โ Kimi K2.6 SWE-Bench Pro 58.6์ , Qwen 3.6 SWE-bench 77.2%.
- VS Code์์ IDE ์๋ ์์ฑ: Continue.dev ๊ฒฝ์ `ollama run codestral:22b` โ FIM ์ต์ ํ, ์ต๊ณ ์ ๋ก์ปฌ Copilot ๋์.
- ์ด๋ฏธ ๋ค๋ฅธ ๋ชจ๋ธ ์ฌ์ฉ ์ค: ๊ตฌํ ๋ชจ๋ธ์ ์คํ ์ค์ด๋ผ๋ฉด Qwen3 8B๋ก ์ ๊ทธ๋ ์ด๋ํ์ญ์์ค โ ์๋นํ ํ์ง ํฅ์.
๐ ๏ธPractice: ๋จผ์ ํ๋์จ์ด์ ๋ง๋ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ ํํ ํ ์ฉ๋์ ๋ง๊ฒ ์ต์ ํํ์ญ์์ค. 8 GB์ด๋ฉด Qwen3 8B๊ฐ ์ต์ ์ ๋๋ค. 16 GB ์ด์์ด๋ฉด ๋์ ๋๊ฒ ํฅ์๋ ์ถ๋ก ์ ์ํด Devstral Small 24B ๋๋ Qwen 3.6 27B๋ก ์ ๊ทธ๋ ์ด๋ํ์ญ์์ค. ์ ์คํ๋๋ ๋ชจ๋ธ์ด ๊ฒจ์ฐ ๋์๊ฐ๋ ์๋ฒฝํ ๋ชจ๋ธ๋ณด๋ค ๋ซ์ต๋๋ค.
8 GB VRAM ์ต๊ณ ์ฝ๋ฉ LLM (RTX 3060 12GB / RTX 3070 8GB / RX 6800 16GB)
8 GB RAM ํ๊ฒฝ์์๋ Qwen3 8B๊ฐ ์ฝ๋ฉ์ ์ต์ ์ ๋๋ค. HumanEval 72% ์ ํ๋๋ฅผ ๋ฌ์ฑํ๋ฉด์ VRAM์ 5 GB๋ง ์ฌ์ฉํ์ฌ IDE, ๋ธ๋ผ์ฐ์ , ๊ธฐํ ์ ํ๋ฆฌ์ผ์ด์ ์ ์ํ 3 GB๊ฐ ๋จ์ต๋๋ค. Qwen3 8B๋ Continue.dev๋ฅผ ํตํ VS Code ์๋ ์์ฑ์ ์ํ FIM(fill-in-the-middle)์ ์ง์ํฉ๋๋ค.
- Qwen3 8B (๊ถ์ฅ) โ HumanEval 72%, VRAM 5 GB, 20โ35 tok/sec, FIM ์ง์. `ollama run qwen3:8b`
- Phi-4 Mini 3.8B โ MMLU 68% (์ถ๋ก ), VRAM 2.5 GB, ๊ฒฝ๋ ์ถ๋ก ์ ์ต์ . `ollama run phi:3.8`
- Llama 3.2 3B โ 40โ60 tok/sec, VRAM 2.5 GB, ๋งค์ฐ ์ ํ๋ ํ๊ฒฝ์ ๋์. `ollama run llama3.2:3b`
16 GB VRAM ์ต๊ณ ์ฝ๋ฉ LLM (RTX 4070 12GB / RTX 4070 Ti 16GB / RTX 5000 24GB)
16 GB RAM ํ๊ฒฝ์์๋ Devstral Small 24B ๋๋ Qwen 3.6 27B๋ฅผ ์คํํ ์ ์์ต๋๋ค. Devstral Small์ ์์ด์ ํธ ์ํฌํ๋ก์ฐ(๋ฉํฐํ์ผ ํธ์ง, ํด ์ฝ๋ง, ๋๋ฒ๊น ๋ฃจํ)์ ์ต์ ์ ๋๋ค. Qwen 3.6 27B๋ ๋ชจ๋ ํ๋ผ๋ฏธํฐ๊ฐ ํ์ฑํ(MoE ์ค๋ฒํค๋ ์์)๋์ด ์ต๊ณ ํ์ง(SWE-bench 77.2%)์ ์ ๊ณตํฉ๋๋ค.
- Devstral Small 24B โ ์์ด์ ํธ ์ฝ๋ฉ์ ์ต์ , ํด ์ฝ๋ง, ๋ฉํฐํ์ผ ํธ์ง, VRAM 16 GB, 15โ25 tok/sec. `ollama run devstral-small:24b`
- Qwen 3.6 27B โ ์ต๊ณ ์ ๋ฐ์งํ ๋ชจ๋ธ, SWE-bench 77.2%, ์ผ๊ด๋ ์ถ๋ก , VRAM 22 GB (RTX 4090์์ ์คํ ๊ฐ๋ฅ). `ollama run qwen3.6:27b`
- DeepSeek-Coder V2 HumanEval 81%, MoE ํจ์จ, 16 GB์์ ์คํ ๊ฐ๋ฅ. `ollama run deepseek-coder-v2`
6 GB VRAM ์ต๊ณ ์ฝ๋ฉ LLM (๋ณด๊ธํ GPU / ๋ด์ฅ ๊ทธ๋ํฝ)
4โ6 GB VRAM ํ๊ฒฝ(๋ณด๊ธํ GPU, ๊ตฌํ ๋ ธํธ๋ถ, Intel iGPU)์์๋ Phi-4 Mini 3.8B๊ฐ ์ต์ ์ ๋๋ค. MMLU ์ถ๋ก ์ฑ๋ฅ 68%๋ฅผ ๋ฌ์ฑํ๋ฉด์ VRAM์ 2.5 GB๋ง ์ฌ์ฉํ์ฌ ์์คํ ์ ์ํ ~3.5 GB๊ฐ ๋จ์ต๋๋ค.
- Phi-4 Mini 3.8B (๊ถ์ฅ) โ MMLU ์ถ๋ก 68%, VRAM 2.5 GB, ๋ ผ๋ฆฌ ๋ฐ ๋๋ฒ๊น ์ ํ์. `ollama run phi:3.8`
- Qwen3 4B โ ์ํ ๋ณํ, VRAM 4 GB, ๋ณด๊ธํ ํ๋์จ์ด์์ ๊ท ํ ์กํ ํ์ง-์๋. `ollama run qwen3:4b`
๐งญ ์ฌ์ฉ์ ์ ํ๋ณ ์ถ์ฒ
- ์ด๋ณด์ (๋ก์ปฌ LLM ๊ฒฝํ ์์): LM Studio + Qwen3 8B โ GUI ์ ๊ณต, ํฐ๋ฏธ๋ ๋ถํ์, ์ฝ๋ ์์ฑ์ ์ํ FIM ํฌํจ, VRAM 5 GB.
- ๋ ธํธ๋ถ ๊ฐ๋ฐ์ (8โ16 GB RAM, ์ผ์์ ์ฝ๋ฉ): Ollama + Qwen3 8B (8 GB ํ๊ฒฝ) ๋๋ Devstral Small 24B (16 GB ํ๊ฒฝ) โ ๊ท ํ ์กํ ํ์ง๊ณผ ์ฑ๋ฅ, ์ฅ์๊ฐ ์์ ์ ์ผ๋ก ์คํ๋จ.
- ๊ณ ๊ธ ๊ฐ๋ฐ์ (๋๋ฒ๊น , ๋ฆฌํฉํ ๋ง, ๋ณต์กํ ์ถ๋ก ): Ollama + Qwen 3.6 27B (๋ฐ์งํ ๋ชจ๋ธ, ์ผ๊ด๋ ์ถ๋ก ) ๋๋ Kimi K2.6 (์์ํ, SWE-Bench Pro 58.6์ ์ต๊ณ ํ์ง) โ ๋ฉํฐํ์ผ ๋งฅ๋ฝ๊ณผ ์๊ณ ๋ฆฌ์ฆ ์ค๊ณ ์ฒ๋ฆฌ.
- IDE ์ค์ฌ ์ํฌํ๋ก์ฐ (VS Code, Cursor, JetBrains): Continue.dev + Codestral 22B โ ์ปค์ ์์น์์ ์๋ํฐ ๋ด ์ฝ๋ ์์ฑ์ ์ํ FIM ์ต์ ํ, ์ต๊ณ ์ ๋ก์ปฌ Copilot ๋์.
- ๋ณด์์ด ์ค์ํ ํ๊ฒฝ (GDPR, HIPAA, ๋ ์ ์ฝ๋): Ollama๋ฅผ ํตํ ์์ ๋ชจ๋ ๋ชจ๋ธ โ ์ธ๋ถ API ํธ์ถ ์์, 100% ์จํ๋ ๋ฏธ์ค, ์ฝ๋๊ฐ ์์คํ ๋ฐ์ผ๋ก ๋๊ฐ์ง ์์.
โ ๏ธWarning: โ ํผํ์ญ์์ค: Qwen 3.6 27B (22 GB)๋ฅผ 20 GB ๋ฏธ๋ง์ ์ฌ์ RAM์ด ์๋ ์์คํ ์์ ์คํํ๋ ๊ฒ. ์ง์ฐ ์๊ฐ์ด ์ฌ์ฉ ๋ถ๊ฐ๋ฅํ ์์ค(1โ3 ํ ํฐ/์ด)์ด ๋ฉ๋๋ค. ์ํ ์์คํ ์์๋ Qwen3 8B ๋๋ Devstral Small 24B๋ฅผ ์ฌ์ฉํ์ญ์์ค.
โ ๏ธWarning: โ ํผํ์ญ์์ค: IDE ์๋ ์์ฑ์ด ํ์ํ ๋ ๋ฒ์ฉ ๋ชจ๋ธ(Llama 3.3 8B)์ ์ฌ์ฉํ๋ ๊ฒ. FIM ์ง์์ด ์๋ ์ฝ๋ ํนํ ๋ชจ๋ธ๋ง ์๋ํฐ ๋ด ์๋ ์์ฑ์ ์ ํฉํฉ๋๋ค โ Codestral 22B, Qwen3 8B.
๐Insight: ์ด๋ณด์ โ ์ค๊ธ์ โ ๊ณ ๊ธ์๋ ํ๋์จ์ด ์๊ตฌ์ฌํญ์ ์งํ์ด๊ธฐ๋ ํฉ๋๋ค. Qwen3 8B (8 GB)๋ก ์์ํ๊ณ , ๋๊ตฌ์ ์ํฌํ๋ก์ฐ๊ฐ ๋์ด๋จ์ ๋ฐ๋ผ Devstral Small 24B (16 GB)๋ก ์ ๊ทธ๋ ์ด๋ํ๋ฉฐ, ์ต๊ณ ์ ์ถ๋ก ํ์ง์ด ํ์ํ ๋๋ง Qwen 3.6 27B ๋๋ Kimi K2.6 (20 GB ์ด์)์ผ๋ก ์งํํ์ญ์์ค.
โ ์ฝ๋ฉ์ ๋ก์ปฌ LLM์ ์ฌ์ฉํ์ง ๋ง์์ผ ํ ๋
- ์ต์ ํ๋ ์์ํฌ ์ง์ (2025๋ ์ดํ API)์ด ํ์ํ ๋: ๋ก์ปฌ ๋ชจ๋ธ์ ๊ณ ์ ๋ ํ์ต ๋ง๊ฐ์ผ์ ๊ธฐ์ค์ผ๋ก ํฉ๋๋ค. Qwen3-Coder๋ 2024๋ 3๋ถ๊ธฐ๊น์ง, DeepSeek-Coder๋ 2024๋ ์ค๋ฐ๊น์ง ํ์ต๋์์ต๋๋ค. ๋ชจ๋ธ ํ์ต ์ดํ ์ถ์๋ Vue 3.5, Next.js 15, Python 3.13 API์๋ ์ง์์ ์ผ๋ก ์ ๋ฐ์ดํธ๋๋ GPT-5.5 ๋๋ Claude Sonnet 4.6์ ์ฌ์ฉํ์ญ์์ค.
- ๋ํ ์ฝ๋๋ฒ ์ด์ค (100k+ ํ ํฐ)์์ ๋ฉํฐํ์ผ ์ถ๋ก ์ด ํ์ํ ๋: ๋ก์ปฌ ๋ชจ๋ธ์ ๋งค์ฐ ๊ธด ์ปจํ ์คํธ์์ ์ฑ๋ฅ์ด ์ ํ๋ฉ๋๋ค. ์ง์ฐ ์๊ฐ์ด ํ์ฉ ๋ถ๊ฐ๋ฅํด์ง๋๋ค. ํด๋ผ์ฐ๋ ๋ชจ๋ธ (GPT-5.5, Claude)์ 100k+ ํ ํฐ ์ปจํ ์คํธ๋ฅผ ๊ธฐ๋ณธ์ ์ผ๋ก ์ฒ๋ฆฌํฉ๋๋ค. ์ ์ฒด ์๋น์ค์ ์ํคํ ์ฒ ๋ฆฌํฉํ ๋ง์๋ ํด๋ผ์ฐ๋ ๋ชจ๋ธ์ ์ฌ์ฉํ์ญ์์ค.
- ์ง์ฐ ์๊ฐ์ด 300ms ๋ฏธ๋ง์ด์ด์ผ ํ๋ ๊ฒฝ์ฐ (์ค์๊ฐ ๋ํํ ์ฝ๋ฉ): ๋ก์ปฌ ๋ชจ๋ธ์ CPU์์ 15โ25 ํ ํฐ/์ด๋ก ์คํ๋์ด(์ผ๋ฐ ๋ ธํธ๋ถ ๊ธฐ์ค) ์๋ต๋น 5โ10์ด์ ์ง์ฐ์ด ๋ฐ์ํฉ๋๋ค. GitHub Copilot๊ณผ Claude๋ IDE์์ 1์ด ์ด๋ด์ ์ ์์ ์์ฑํฉ๋๋ค. ํค์คํธ๋กํฌ ์์ค์ ์๋ ์์ฑ์๋ ๋ก์ปฌ ๋ชจ๋ธ์ด ๋๋ฌด ๋๋ฆฝ๋๋ค.
- ์ต๊ณ ์์ค์ ๋๋ฒ๊น ์ ํ๋๊ฐ ํ์ํ ๋: ๋ณต์กํ ๋๋ฒ๊น ์์ (์ฌ๋ฌ ํจ์ ํธ์ถ ์คํ ์ถ์ , ๋ฏธ๋ฌํ ํ์ ์ค๋ฅ ์๋ณ)์์ GPT-5.5์ Claude Sonnet 4.6์ ์ค์ ์ฝ๋ ์ด์์์ ๋ก์ปฌ ๋ชจ๋ธ๋ณด๋ค 15โ20% ๋ ๋์ ์ ์๋ฅผ ๊ธฐ๋กํฉ๋๋ค. ๋ก์ปฌ ๋ชจ๋ธ์ ์์ฑ์ ๋ฐ์ด๋๊ณ , ์ต์ฒจ๋จ ๋ชจ๋ธ์ ์ง๋จ์ ๋ฐ์ด๋ฉ๋๋ค.
- ์์ฑ๋ ์ฝ๋์ ํ๊ฐ์ ํ์ฉํ ์ ์์ ๋: ๋ก์ปฌ 7B ๋ชจ๋ธ์ ๋ณต์กํ ์์ ์์ ์ฝ 2%์ ๋น์จ๋ก ๊ตฌ๋ฌธ์ ์ผ๋ก ์ ํจํ์ง๋ง ๋ ผ๋ฆฌ์ ์ผ๋ก ์๋ชป๋ ์ฝ๋๋ฅผ ์์ฑํฉ๋๋ค. ํด๋ผ์ฐ๋ ๋ชจ๋ธ์ 0.5% ๋ฏธ๋ง์ ํ๊ฐ ๋น์จ์ ๋ณด์ ๋๋ค. ๋ฏธ์ ํฌ๋ฆฌํฐ์ปฌ ์ฝ๋(๊ฒฐ์ ์์คํ , ๋ณด์)์๋ ์ธ๊ฐ ๊ฒํ ๊ฐ ํ์ํ๊ฑฐ๋ ์ต์ฒจ๋จ API๋ฅผ ์ฌ์ฉํ์ญ์์ค.
๐Insight: ๐ ๋ก์ปฌ LLM์ ๊ฐ์ : ๊ฐ์ธ์ ๋ณด ๋ณดํธ + ์คํ๋ผ์ธ ์์ + ๋น์ฉ ์ ๊ฐ โ ์ต๊ณ ์ฑ๋ฅ์ ์ํ ๊ฒ์ด ์๋๋๋ค. ์ด ์ธ ๊ฐ์ง ์์๋ณด๋ค ์ต๋ ์ ํ๋๊ฐ ๋ ์ค์ํ๋ค๋ฉด ํด๋ผ์ฐ๋ API๋ฅผ ์ฌ์ฉํ์ญ์์ค.
๐ ์ฝ๋ฉ์ฉ ์ต๊ณ ๋ก์ปฌ LLM ๋น๊ต (์์ฌ๊ฒฐ์ ๋งคํธ๋ฆญ์ค)
์ด๋ค ์ฝ๋ฉ ๋ชจ๋ธ์ ์ ํํด์ผ ํ ์ง ๋ชจ๋ฅด๊ฒ ์ต๋๊น? PromptQuorum์ ์ฌ์ฉํ๋ฉด ํ๋์ ํ๋กฌํํธ๋ฅผ ์ฌ๋ฌ ๋ชจ๋ธ(Kimi K2.6, Qwen 3.6, Devstral, GPT-5.5, Claude)์ ๋์์ ์ ์กํ๊ณ ์ค์ ์ฝ๋์ ๋ํ ๋๋ํ ๋ณด๊ธฐ ์ถ๋ ฅ, ์ค์ ์๋ต ์๊ฐ, ์ ํ๋๋ฅผ ํ์ธํ ์ ์์ต๋๋ค. PromptQuorum ๋ฌด๋ฃ ์ฒดํ โ 5๋ถ, ํ์๊ฐ์ ๋ถํ์.
| Model | Best For | VRAM | Speed | Strength | When to Pick |
|---|---|---|---|---|---|
| Kimi K2.6 (์์ํ) | ์ต๋ ๋ก์ปฌ ํ์ง, ์ค์ ํ๊ฒฝ ๋ฒค์น๋งํฌ | ๋ค์ (์์ํ) | 15โ25 tok/sec | SWE-Bench Pro 58.6์ , MoE (32B ํ์ฑ / 1T ์ ์ฒด), Modified MIT ๋ผ์ด์ ์ค | ๋๋ฒ๊น /๋ฆฌํฉํ ๋ง์ ์ํ ์ต๋ ๋ก์ปฌ ํ์ง๊ณผ ์คํ๋ผ์ธ ๊ธฐ๋ฅ์ด ํ์ํ ๋ |
| Qwen 3.6 27B | ์ต๊ณ ์ ๋ฐ์งํ ๋ชจ๋ธ, ๋ฉํฐํ์ผ ์ถ๋ก | ~22 GB | 12โ20 tok/sec | SWE-bench 77.2%, ๋ชจ๋ ํ๋ผ๋ฏธํฐ ํ์ฑ, ์ผ๊ด๋ ์ถ๋ก | 22 GB ์ด์์ RAM์ด ์๊ณ ๋์ฉ๋ ํ์ผ์์ ์์ธก ๊ฐ๋ฅํ ์ฑ๋ฅ์ ์ํ ๋ |
| Devstral Small 24B | ์์ด์ ํธ ์ฝ๋ฉ ์ํฌํ๋ก์ฐ | ~16 GB | 15โ25 tok/sec | ๋ฉํฐํ์ผ ํธ์ง, ํด ์ฝ๋ง, ์ค๋ฅ ๋ณต๊ตฌ, ์ค๋ฅ ๋ฃจํ | aider, ๋ค๋จ๊ณ ์ํฌํ๋ก์ฐ, Claude Code ์คํ์ผ ์์ด์ ํธ๋ฅผ ์ฌ์ฉํ ๋ |
| Codestral 22B | IDE ์๋ ์์ฑ (VS Code, Cursor) | ~14 GB | 20โ30 tok/sec | FIM ์ต์ ํ, ์ต๊ณ ์ ๋ก์ปฌ Copilot ๋์, Continue.dev ๊ธฐ๋ณธ ํตํฉ | Continue.dev๋ฅผ ํตํด ํค์คํธ๋กํฌ ์์ค์ IDE ์๋ ์์ฑ์ ์ํ ๋ |
| Qwen3 8B | ๋ ธํธ๋ถ ์ฝ๋ฉ, 8 GB RAM ์ต์ | ~5 GB | 30โ45 tok/sec | ์ด ๊ตฌ๊ฐ์์ ๊ฐ์ฅ ๋น ๋ฆ, ํฅ์๋ ์ฝ๋ฉ, FIM ์ง์, ๋ค๊ตญ์ด | 8 GB RAM์ด ์๊ณ ํด๋น ๊ตฌ๊ฐ์ ์ต๊ณ ๋ก์ปฌ ์ฝ๋ฉ ๋ชจ๋ธ์ ์ํ ๋ |
| GPT-5.5 (ํด๋ผ์ฐ๋) | ์ต์ API, ๋ณต์กํ ์ถ๋ก , ์ต๊ณ ์ฑ๋ฅ | N/A (ํด๋ผ์ฐ๋) | <1์ด | ์ต๊ณ ์ ํ๋, ์ต๊ทผ ํ์ต ๋ง๊ฐ์ผ, ๋ฉํฐํ์ผ ์ถ๋ก | ์ต๊ณ ์ฑ๋ฅ, ์ค์๊ฐ ์ง์ฐ, ๋๋ ์ต์ ํ๋ ์์ํฌ ์ง์์ด ํ์ํ ๋ |
| Claude Sonnet 4.6 (ํด๋ผ์ฐ๋) | ์ฝ๋ ๋ฆฌ๋ทฐ, ์ํคํ ์ฒ ๊ฒฐ์ , ๋๋ฒ๊น ์ ํ๋ | N/A (ํด๋ผ์ฐ๋) | <1์ด | ์ฝ๋ ์ดํด, ๋๋ฒ๊น , ๋ฉํฐํ์ผ ์ปจํ ์คํธ์ ์ต์ | ๋น์ฉ์ด๋ ๊ฐ์ธ์ ๋ณด๋ณด๋ค ๋๋ฒ๊น ์ ํ๋์ ์ฝ๋ ๋ฆฌ๋ทฐ๋ฅผ ์ฐ์ ์ํ ๋ |
์ง์ญ๋ณ ์๊ตฌ์ฌํญ์ด ์ฝ๋ฉ ๋ชจ๋ธ ์ ํ์ ์ด๋ค ์ํฅ์ ๋ฏธ์นฉ๋๊น?
EU / GDPR
๋ ์ ์ฝ๋๋ฒ ์ด์ค๋ฅผ ๋ค๋ฃจ๋ EU ์ํํธ์จ์ด ๊ฐ๋ฐ ํ์ ๊ฒฝ์ฐ, ๋ก์ปฌ ์ฝ๋ ์์ฑ์ ์ฌ์ฉํ๋ฉด ์์ค ์ฝ๋๊ฐ ์กฐ์ง์ ์ธํ๋ผ ๋ฐ์ผ๋ก ๋๊ฐ์ง ์์ต๋๋ค. GDPR ์ 32์กฐ๋ ์ ์ ํ ๊ธฐ์ ์ ๋ณด์ ์กฐ์น๋ฅผ ์๊ตฌํฉ๋๋ค โ ์์ค ์ฝ๋๋ฅผ ํด๋ผ์ฐ๋ AI API์ ์ ์กํ๋ฉด ์ 28์กฐ์ ๋ฐ๋ฅธ ์ถ๊ฐ์ ์ธ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ๊ด๊ณ๊ฐ ํ์ฑ๋ฉ๋๋ค. ๋ก์ปฌ ์ถ๋ก ์ ์ด๋ฅผ ์ ๊ฑฐํฉ๋๋ค.
Qwen3-Coder 32B (Alibaba, Apache 2.0)์ DeepSeek-Coder V2 (DeepSeek, MIT) ๋ชจ๋ ์์ ํ ์จํ๋ ๋ฏธ์ค ์คํ์ด ๊ฐ๋ฅํฉ๋๋ค. EU ๋ด์์ EU ์ถ์ ๋ชจ๋ธ์ ์ ํธํ๋ ์กฐ์ง์ ๊ฒฝ์ฐ: Mistral AI (ํ๋์ค)์ ์ฝ๋ฉ ์ง์ ๋ชจ๋ธ(Mistral Small 3.1, Codestral)์ด Apache 2.0 ๋ผ์ด์ ์ค๋ฅผ ๊ฐ์ง๊ณ ์์ต๋๋ค. EU AI ๋ฒ(2025๋ 2์ ์ํ)์ ์ค์ ์ธํ๋ผ๋ฅผ ์ํ AI ์ง์ ์ฝ๋ ์์ฑ์ ์ ์ฌ์ ์ผ๋ก ๊ณ ์ํ์ผ๋ก ๋ถ๋ฅํฉ๋๋ค โ ์จํ๋ ๋ฏธ์ค ์ถ๋ก ์ ํ์ดํ๋ผ์ธ์ ๊ธฐ์กด ๋ณด์ ๊ฒฝ๊ณ ๋ด์ ์ ์งํฉ๋๋ค.
์ผ๋ณธ (METI)
METI ์ฌ์ด๋ฒ๋ณด์ ์ง์นจ์ ์ํํธ์จ์ด ๊ฐ๋ฐ์์์ AI ๋๊ตฌ ์ฌ์ฉ์ ์ ์ ๋ ๋ค๋ฃจ๊ณ ์์ต๋๋ค. Qwen3-Coder๋ ์ผ๋ณธ์ด ์ฝ๋ ์ฃผ์๊ณผ ๋ณ์ ๋ช ๋ช ๊ท์น์ ๊ธฐ๋ณธ์ ์ผ๋ก ์ฒ๋ฆฌํฉ๋๋ค โ ์ผ๋ณธ์ด ์ธ๋ผ์ธ ๋ฌธ์๊ฐ ์๋ ์ผ๋ณธ ๊ฐ๋ฐ ์ฝ๋๋ฒ ์ด์ค์ ์ ์ฉํฉ๋๋ค. ๊ท์ ์ค์ ๊ธฐ๋ก์ ์ํด Ollama ํ๊ทธ(์: qwen2.5-coder:32b)๋ METI AI ๊ฑฐ๋ฒ๋์ค ๋ฌธ์์ ํ์ํ ์ ํํ ๋ฒ์ ์๋ณ์๋ฅผ ์ ๊ณตํฉ๋๋ค.
์ค๊ตญ
์ค๊ตญ์ ๋ฐ์ดํฐ๋ณด์๋ฒ(ๆฐๆฎๅฎๅ จๆณ)์ ๋ฐ๋ผ ์ค์ ์ ๋ณด ์ธํ๋ผ์ ์์ค ์ฝ๋๋ ์ธ๊ตญ ํด๋ผ์ฐ๋ ์๋น์ค์์ ์ฒ๋ฆฌ๋ ์ ์์ต๋๋ค. Qwen3-Coder (Alibaba, Apache 2.0)๋ ์ค๊ตญ ๊ธฐ์ ์ ์ฝ๋ฉ ์ํฌํ๋ก์ฐ์ ์์ฐ์ค๋ฌ์ด ์ ํ์ ๋๋ค โ ์ค๊ตญ ๊ฐ๋ฐ์ฌ, Apache 2.0 ๋ผ์ด์ ์ค, Ollama๋ฅผ ํตํ ์์ ํ ์จํ๋ ๋ฏธ์ค ๋ฐฐํฌ. 2026๋ 6์ ๊ธฐ์ค, Qwen3-Coder 32B๋ ๋ก์ปฌ์์ ์คํ ๊ฐ๋ฅํ ๊ฐ์ฅ ๋์ ์ ์์ ์ฝ๋ฉ ๋ชจ๋ธ์ ๋๋ค.
๋ก์ปฌ ์ฝ๋ฉ ๋ชจ๋ธ์ ํํ ์ค์๋ ๋ฌด์์ ๋๊น?
- ๋ชจ๋ธ ์ ํ ์ HumanEval๋ง์ ์ ์ผํ ๋ฒค์น๋งํฌ๋ก ์ฌ์ฉํ๋ ๊ฒ: HumanEval์ ๋จ์ผ ํจ์ Python ์์ฑ์ ํ ์คํธํฉ๋๋ค. ์ค์ ๊ฐ๋ฐ์์๋ ๋ฉํฐํ์ผ ์ถ๋ก , ํ ์คํธ ์์ฑ, ์ฝ๋๋ฒ ์ด์ค ์ดํด๊ฐ ํ์ํฉ๋๋ค. SWE-bench๊ฐ ์ค์ ์ฝ๋ฉ ์ฑ๋ฅ์ ๋ ์ ์์ธกํฉ๋๋ค. HumanEval 72%์ด์ง๋ง SWE-bench 77% (Qwen 3.6)์ธ ๋ชจ๋ธ์ด HumanEval 87%์ด์ง๋ง SWE-bench ๋ฏธํ ์คํธ์ธ ๋ชจ๋ธ์ ์ค์ฉ์ ์ํฌํ๋ก์ฐ์์ ๋ฅ๊ฐํ ๊ฒ์ ๋๋ค.
- ์ด ํ๋ผ๋ฏธํฐ ์๊ฐ ๋๋ฌด ์ปค ๋ณด์ธ๋ค๊ณ MoE ๋ชจ๋ธ์ ๋ฌด์ํ๋ ๊ฒ: Kimi K2.6๋ ์ด 1T ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง๋ง ํ ํฐ๋น 32B๋ง ํ์ฑํ๋ฉ๋๋ค. MoE ๋ชจ๋ธ์ ์ด ํ๋ผ๋ฏธํฐ ์๊ฐ ์์ฌํ๋ ๊ฒ๋ณด๋ค ๋น ๋ฅด๊ณ VRAM์ ์ ๊ฒ ์ฌ์ฉํฉ๋๋ค. 1T MoE ๋ชจ๋ธ์ ๋ฐ์งํ 70B ๋ชจ๋ธ์ด ํ์๋ก ํ๋ ํ๋์จ์ด์์ ์คํ๋ ์ ์์ต๋๋ค.
- ์ฝ๋ ํนํ ๋ชจ๋ธ ๋์ ๋ฒ์ฉ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๊ฒ: Qwen3 8B (์ฝ๋ฉ ํนํ)๋ ์ ์ฌํ HumanEval ์ ์์๋ ๋ถ๊ตฌํ๊ณ ์ค์ ์์ ์์ Llama 3.3 8B ์ผ๋ฐ (๋ฒ์ฉ)๋ณด๋ค ์ฑ๋ฅ์ด ๋ฐ์ด๋ฉ๋๋ค. IDE ์๋ ์์ฑ์๋ ํญ์ FIM ์ง์์ด ์๋ ์ฝ๋ ํนํ ๋ชจ๋ธ์ ์ฌ์ฉํ์ญ์์ค.
- ๋ฉํฐํ์ผ ๋ฆฌ๋ทฐ ์ ์ปจํ ์คํธ ๊ธธ์ด๋ฅผ ์ค์ ํ์ง ์๋ ๊ฒ: Ollama์ ๊ธฐ๋ณธ๊ฐ์ 2048 ํ ํฐ์ ๋๋ค. ๋๋ถ๋ถ์ ์ฝ๋ ํ์ผ์ 1,000โ3,000 ํ ํฐ์ ๋๋ค. ์ ์ฒด ํ์ผ์ด๋ ์ฌ๋ฌ ํจ์๊ฐ ํฌํจ๋ ์ฝ๋ฉ ์์ ์๋ Modelfile์์ `PARAMETER num_ctx 32768`์ ์ค์ ํ์ญ์์ค.
- RAM์ ์ ์ฝํ๊ธฐ ์ํด ์ฝ๋ฉ ๋ชจ๋ธ์ Q3_K_S๋ฅผ ์ฌ์ฉํ๋ ๊ฒ: Q4_K_M ๋ฏธ๋ง์ ์์ํ๋ ์ฝ๋ ์์ฑ ์ ํ๋๋ฅผ ๋์ ๋๊ฒ ์ ํ์ํต๋๋ค โ ๋ ผ๋ฆฌ์ ์ค๋ฅ์ ๊ตฌ๋ฌธ ์ค์๊ฐ ์ฆ๊ฐํฉ๋๋ค. ์ฝ๋ฉ ์์ ์๋ ์ต์ Q4_K_M์ ์ฌ์ฉํ์ญ์์ค. RAM์ด ๋ถ์กฑํ๋ค๋ฉด Q3_K_S์ ๋ํ ๋ชจ๋ธ๋ณด๋ค Q4_K_M์ ์ํ ๋ชจ๋ธ์ ์ ํํ์ญ์์ค.
- ํ๋กฌํํธ ์์ง๋์ด๋ง์ด ๋ชจ๋ธ์ ๊ด๊ณ์์ด ์ถ๋ ฅ ํ์ง์ ๊ฒฐ์ ํฉ๋๋ค: ์ธ์ด, ์ ์ฝ ์กฐ๊ฑด, ํ ์คํธ ์ผ์ด์ค, ์ค๋ฅ ์ฒ๋ฆฌ๋ฅผ ํ๋กฌํํธ์ ๋ช ํํ ์ง์ ํ๋ฉด ํ๊ฐ๋ ์ฝ๋๊ฐ ํฌ๊ฒ ์ค์ด๋ญ๋๋ค. ์ค์ ๊ฒ์ฆ๋ ํจํด์ ๋ํด์๋ AI๋ก ๋ ๋์ ์ฝ๋ ์์ฑํ๊ธฐ๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
โ ๏ธWarning: ์ฝ๋ฉ ๋ชจ๋ธ์ Q4_K_M ๋ฏธ๋ง์ ์์ํ๋ฅผ ์ ๋ ์ฌ์ฉํ์ง ๋ง์ญ์์ค. Q3_K_S๋ RAM์ ์ ์ฝํ์ง๋ง ๊ตฌ๋ฌธ ์ค๋ฅ์ ๋ ผ๋ฆฌ์ ๋ฒ๊ทธ๋ฅผ ๋ฐ์์ํต๋๋ค. ์ด๊ฒ์ ์ฝ๋ ์์ฑ์ ๊ฐ์น ์๋ ํธ๋ ์ด๋์คํ๊ฐ ์๋๋๋ค โ Q4_K_M์ ์ฌ์ฉํ๊ฑฐ๋ ์ ์ฒด ์ ๋ฐ๋์ ์ํ ๋ชจ๋ธ์ ์ ํํ์ญ์์ค.
FAQ
2026๋ 6์ ๊ธฐ์ค ์ฝ๋ฉ์ ๊ฐ์ฅ ์ ํฉํ ๋ก์ปฌ LLM์ ๋ฌด์์ ๋๊น?
Kimi K2.6 โ SWE-Bench Pro 58.6์ (MoE, Modified MIT ๋ผ์ด์ ์ค). ์ต๊ณ ์ ๋ฐ์งํ ๋ชจ๋ธ: Qwen 3.6 27B โ SWE-bench 77.2%, VRAM 22 GB. 8 GB ํ๊ฒฝ: Qwen3 8B. IDE ์๋ ์์ฑ: Codestral 22B.
HumanEval์ด๋ ๋ฌด์์ด๋ฉฐ ์ ์ค์ํฉ๋๊น?
HumanEval์ 164๊ฐ์ Python ํ๋ก๊ทธ๋๋ฐ ๋ฌธ์ ๋ฒค์น๋งํฌ์ ๋๋ค. ๋ชจ๋ธ์ ๊ฐ ๋ฌธ์ ์ ๋ํ ์ฌ๋ฐ๋ฅธ ํจ์ ๋ณธ๋ฌธ์ ์์ฑํด์ผ ํฉ๋๋ค. ์ฒซ ๋ฒ์งธ ์๋์์ ํด๊ฒฐํ ๋น์จ(Pass@1)์ด ํ์ค ์งํ์ ๋๋ค. ์ฝ๋ฉ ๋ชจ๋ธ ๋น๊ต์ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ์ฒ๋์ ๋๋ค.
FIM(fill-in-the-middle)์ด๋ ๋ฌด์์ด๋ฉฐ ์ด๋ค ๋ชจ๋ธ์ด ์ง์ํฉ๋๊น?
FIM์ ์ปค์ ์๋ค์ ์ฝ๋๋ฅผ ๋ชจ๋ ๊ณ ๋ คํ์ฌ ์ฝ๋๋ฅผ ์์ฑํ๋ ๊ธฐ๋ฅ์ผ๋ก, IDE ์๋ ์์ฑ์ ์ฌ์ฉ๋๋ ํจํด์ ๋๋ค. Qwen3-Coder, DeepSeek-Coder, Starcoder2๋ ๋ชจ๋ FIM์ ์ง์ํฉ๋๋ค. Llama 3.3 8B ์ผ๋ฐ ๋ชจ๋ธ์ ์ง์ํ์ง ์์ต๋๋ค. IDE ํตํฉ์๋ FIM ์ง์ ๋ชจ๋ธ์ ์ฌ์ฉํ์ญ์์ค.
๋ก์ปฌ ์ฝ๋ฉ ๋ชจ๋ธ์ด GitHub Copilot์ ๋์ฒดํ ์ ์์ต๋๊น?
Continue.dev๋ฅผ ํตํ Codestral 22B๋ ์ด์ ๋๋ถ๋ถ์ ์๋ ์์ฑ ์์ ์์ Copilot์ ๊ทผ์ ํฉ๋๋ค. ๋ณต์กํ ๋ฉํฐํ์ผ ์ถ๋ก ์์๋ ํด๋ผ์ฐ๋ ๋ชจ๋ธ์ด ๊ฐ์ฅ ์ด๋ ค์ด 20%์์ ์ฌ์ ํ ์ฐ์๋ฅผ ๋ณด์ ๋๋ค. ํธ๋ ์ด๋์คํ: Codestral์ ๋ ๋๋ฆฌ์ง๋ง ์์ ํ ๋น๊ณต๊ฐ์ด๋ฉฐ ๋ก์ปฌ์์ ์คํ๋ฉ๋๋ค.
๋ก์ปฌ ์ฝ๋ฉ LLM์ ์ผ๋ง๋ ๋ง์ RAM์ด ํ์ํฉ๋๊น?
์ต์ 4 GB (์ํ 3B ๋ชจ๋ธ), ์ค์ฉ์ ์ผ๋ก๋ 8 GB ์ด์์ด ํ์ํฉ๋๋ค. ๊ถ์ฅ: 7Bโ16B ๋ชจ๋ธ์ ์ฌ์ ๊ณต๊ฐ์ ๋๊ณ 16 GB. ๊ณ ์ฑ๋ฅ: 32B ๋ชจ๋ธ์ 32 GB ์ด์. ๊ณต์ ์ฌ์ฉ: ๋ชจ๋ธ ํฌ๊ธฐ(GB) โ ํ๋ผ๋ฏธํฐ ์ รท 4 (์: 7B รท 4 โ FP16์์ 1.75 GB, Q4_K_M์์ ์ฝ 4.7 GB).
500์ค Python ํ์ผ์ด ์ผ๋ง๋ ๋ง์ ์ปจํ ์คํธ๋ฅผ ์ฌ์ฉํฉ๋๊น?
500์ค Python ํ์ผ์ ์ฝ 2,000โ3,000 ํ ํฐ์ ์ฌ์ฉํฉ๋๋ค. Ollama์ ๊ธฐ๋ณธ 2048 ํ ํฐ ์ปจํ ์คํธ๋ ๋ถ์กฑํฉ๋๋ค. ๋จ์ผ ํ์ผ ์ฝ๋ ๋ฆฌ๋ทฐ์๋ ์ต์ `PARAMETER num_ctx 16384`๋ฅผ ์ค์ ํ์ญ์์ค. ๋ฉํฐํ์ผ ๋ถ์์๋ 32768 ๋๋ 65536 ์ปจํ ์คํธ๋ฅผ ์ฌ์ฉํ์ญ์์ค.
๋ก์ปฌ ์ฝ๋ฉ ๋ชจ๋ธ์ด ๊ฐ๋ฐ์ ์ถฉ๋ถํ ๋น ๋ฆ ๋๊น?
๋ฐ๋ณต์ ์ธ ์ํฌํ๋ก์ฐ(10โ50 ํ ํฐ/์ด)์๋ ์ถฉ๋ถํฉ๋๋ค. Qwen3 8B๋ ๋ ธํธ๋ถ์์ 20โ35 ํ ํฐ/์ด๋ก ์คํ๋ฉ๋๋ค โ ์ผ๊ด ์์ฑ ์ ์๋ต๋น 5โ10์ด ๊ธฐ๋ค๋ฆฌ๋ ๊ฒ์ ํ์ฉ ๊ฐ๋ฅํฉ๋๋ค. ์ค์๊ฐ ์๋ ์์ฑ(<1์ด ํ์)์๋ ์ ํฉํ์ง ์์ต๋๋ค. IDE ์ฌ์ฉ ์ ๋ก์ปฌ ๋ชจ๋ธ์ ์์ฒญ-๊ฒํ ๋ฐฉ์์๋ ์ ํฉํ์ง๋ง ํค์คํธ๋กํฌ ์๋ ์์ฑ์๋ ์ ํฉํ์ง ์์ต๋๋ค.
๋ก์ปฌ LLM์ด ์ฝ๋ฉ์์ GPT-5.5๋ฅผ ๋์ฒดํ ์ ์์ต๋๊น?
์๋์ค. ๋ก์ปฌ ๋ชจ๋ธ(Kimi K2.6 SWE-Bench Pro 58.6์ , Qwen 3.6 27B SWE-bench 77.2%)์ ๋ค์์์ ๋ค์ฒ์ง๋๋ค: ์ต์ ํ๋ ์์ํฌ ์ง์ (ํ์ต ๋ง๊ฐ์ผ ์ดํ API), ๋ํ ์ฝ๋๋ฒ ์ด์ค ๋ณต์กํ ๋ฉํฐํ์ผ ์ถ๋ก (100k+ ํ ํฐ), ๋๋ฒ๊น ์ ํ๋. ๊ทธ๋ฌ๋ Kimi K2.6์ Qwen 3.6๋ ๋ฉํฐํ์ผ ์ฝ๋ฉ ์์ ์์ ๊ฒฉ์ฐจ๋ฅผ ํฌ๊ฒ ์ขํ์ต๋๋ค.
Qwen3-Coder๊ฐ ๊ฐ์ฅ ์ ์ง์ํ๋ ์ธ์ด๋ ๋ฌด์์ ๋๊น?
Python์ด ์ฃผ์ ํ์ต ์ธ์ด์ ๋๋ค. JavaScript, TypeScript, Java, C++, Go, Rust, SQL๋ ์ ์ง์๋ฉ๋๋ค. PHP, Ruby, Swift, Kotlin๋ ์ฒ๋ฆฌํฉ๋๋ค. ๋นPython ์ธ์ด์ ๊ฒฝ์ฐ HumanEval ์ ์๋ ๋ฎ์ง๋ง ์ฌ์ ํ ๊ฒฝ์๋ ฅ์ด ์์ต๋๋ค.
DeepSeek-Coder๊ฐ ๋ ์ ์ฝ๋์ ์์ ํ๊ฒ ์ฌ์ฉํ ์ ์์ต๋๊น?
Ollama๋ฅผ ํตํด ๋ก์ปฌ์์ ์คํ ์ DeepSeek-Coder๋ ์ธ๋ถ ์ฐ๊ฒฐ์ ํ์ง ์์ต๋๋ค. ์ฝ๋๊ฐ ํ๋์จ์ด์ ๋จ์ต๋๋ค. DeepSeek์ ๋ํ ๋ฐ์ดํฐ ์ฐ๋ ค๋ ํด๋ผ์ฐ๋ API(api.deepseek.com)์ ํด๋นํ๋ฉฐ, ๋ก์ปฌ Ollama ์ถ๋ก ์๋ ์ ์ฉ๋์ง ์์ต๋๋ค. ๋ก์ปฌ ์ถ๋ก ์ ์์ ํ ๋น๊ณต๊ฐ์ ๋๋ค.
Qwen3-Coder์ Qwen3์ ์ฐจ์ด์ ์ ๋ฌด์์ ๋๊น?
Qwen3-Coder๋ ์ฝ๋ ๋ฐ์ดํฐ๋ก ๋ฏธ์ธ ์กฐ์ ๋์ด FIM ์ง์์ ํฌํจํฉ๋๋ค. Qwen3๋ ๋ฒ์ฉ ๋ชจ๋ธ์ ๋๋ค. HumanEval์์ Qwen3 8B์ Qwen3 7B๋ ์ ์ฌํ๊ฒ (72%) ์ ์๋ฅผ ๊ธฐ๋กํ์ง๋ง, Qwen3-Coder์๋ ๋ฒ์ฉ ๋ชจ๋ธ์ ์๋ ์ฝ๋ ์์ฑ ๊ธฐ๋ฅ์ด ํฌํจ๋์ด ์์ต๋๋ค.
๋ก์ปฌ ์ฝ๋ฉ ๋ชจ๋ธ์ SQL ์์ฑ์ ์ฌ์ฉํ ์ ์์ต๋๊น?
์ โ Qwen 3.6 27B์ Kimi K2.6 ๋ชจ๋ SQL ์์ฑ ์์ ์์ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ ๋๋ค. ํ๋กฌํํธ ์ปจํ ์คํธ์ ํ ์ด๋ธ ์คํค๋ง๋ฅผ ํฌํจํ์ญ์์ค. ๋ณต์กํ ๋ฉํฐ์กฐ์ธ ์ฟผ๋ฆฌ์๋ ์ ์ฒด ์คํค๋ง๋ฅผ ํฌํจํ๊ธฐ ์ํด 32K ์ปจํ ์คํธ๋ฅผ ์ฌ์ฉํ์ญ์์ค. ์์คํ ํ๋กฌํํธ๋ฅผ ์ค์ ํ์ญ์์ค: "๋น์ ์ ์ ๋ฌธ SQL ๊ฐ๋ฐ์์ ๋๋ค. ์ ํจํ SQL๋ง ์์ฑํ์ญ์์ค."
SWE-bench๋ ๋ฌด์์ด๋ฉฐ ์ HumanEval์ ๋์ฒดํ๊ณ ์์ต๋๊น?
SWE-bench๋ ์ค์ GitHub ์ด์ ํด๊ฒฐ ๋ฅ๋ ฅ, ์ฆ ์ฝ๋๋ฒ ์ด์ค ์ฝ๊ธฐ, ๋ฉํฐํ์ผ ๋ณ๊ฒฝ, ํ ์คํธ ์์ฑ์ ํ ์คํธํฉ๋๋ค. ๋จ์ผ Python ํจ์๋ฅผ ํ ์คํธํ๋ HumanEval๊ณผ ๋ฌ๋ฆฌ, SWE-bench๋ ์ค์ ๊ฐ๋ฐ ์ํฌํ๋ก์ฐ์์์ ๋ชจ๋ธ ์ฑ๋ฅ์ ์์ธกํฉ๋๋ค. Qwen 3.6 27B๋ SWE-bench์์ 77.2%๋ฅผ ๊ธฐ๋กํฉ๋๋ค. 2026๋ ์๋ SWE-bench๊ฐ ์ค์ ์ฌ์ฉ์ ์ํ ์ฝ๋ฉ ๋ชจ๋ธ ํ๊ฐ์ 1์ฐจ ๋ฒค์น๋งํฌ์ ๋๋ค.
Kimi K2.6๋ ๋ฌด์์ด๋ฉฐ ์ฌ์ฉํด๋ ์์ ํฉ๋๊น?
Kimi K2.6๋ Modified MIT ๋ผ์ด์ ์ค๋ก ์ถ์๋ Moonshot AI (์ค๊ตญ)์ ์คํ์์ค ์ฝ๋ฉ ๋ชจ๋ธ์ ๋๋ค. MoE ์ํคํ ์ฒ (32B ํ์ฑ / 1T ์ ์ฒด ํ๋ผ๋ฏธํฐ)๋ฅผ ์ฌ์ฉํ๋ฉฐ SWE-Bench Pro์์ 58.6์ ์ ๊ธฐ๋กํ์ต๋๋ค. Ollama๋ฅผ ํตํด ๋ก์ปฌ์์ ์คํ ์ ๋ฐ์ดํฐ๊ฐ ์ธ๋ถ๋ก ์ ์ก๋์ง ์์ต๋๋ค โ ๋ชจ๋ธ์ ์ถ์ ์ง์ ๊ด๊ณ์์ด ์ฝ๋๊ฐ ์์คํ ์ ๋จ์ต๋๋ค. Modified MIT ๋ผ์ด์ ์ค๋ ์์ ์ ์ด์ฉ์ ํ์ฉํฉ๋๋ค.
๋ก์ปฌ ์ฝ๋ฉ ๋ชจ๋ธ์ VS Code์ ์ฐ๊ฒฐํ๋ ค๋ฉด ์ด๋ป๊ฒ ํฉ๋๊น?
VS Code ๋ง์ผํ๋ ์ด์ค์์ Continue.dev ํ์ฅ ํ๋ก๊ทธ๋จ์ ์ค์นํ์ญ์์ค. Continue ์ค์ ์์ Ollama๋ฅผ ์ ๊ณต์๋ก ์ ํํ๊ณ ๋ชจ๋ธ์ ์ง์ ํ์ญ์์ค(์: `qwen3:8b`, `qwen3.6:27b`, `codestral:22b`). ํ์ฅ ํ๋ก๊ทธ๋จ์ด localhost:11434์์ Ollama์ ์๋์ผ๋ก ์ฐ๊ฒฐ๋ฉ๋๋ค. ์ธ๋ผ์ธ ์ฝ๋ ์์ฑ์ ํธ๋ฆฌ๊ฑฐํ๋ ค๋ฉด Cmd+I (macOS) ๋๋ Ctrl+I (Windows)๋ฅผ ์ฌ์ฉํ์ญ์์ค.
์ถ์ฒ
- Moonshot AI. (2026). "Kimi K2.6" โ MoE ์ํคํ ์ฒ, Modified MIT ๋ผ์ด์ ์ค, SWE-Bench Pro
- Qwen Team. (2026). "Qwen 3.6 ๊ธฐ์ ๋ณด๊ณ ์" โ SWE-bench 77.2%, ๋ฐ์งํ ์ํคํ ์ฒ
- Mistral AI. (2026). "Devstral Small 24B" โ ์์ด์ ํธ ์ฝ๋ฉ ๋ชจ๋ธ
- Mistral AI. (2025). "Codestral" โ FIM ์ต์ ํ ์ฝ๋ฉ ๋ชจ๋ธ
- Qwen Team. (2025). "Qwen3-Coder ๊ธฐ์ ๋ณด๊ณ ์." https://arxiv.org/abs/2409.12186 โ ๋ชจ๋ ํฌ๊ธฐ ๊ตฌ๊ฐ์ Qwen3-Coder์ ๋ํ HumanEval ๋ฐ MBPP ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ.
- DeepSeek AI. (2024). "DeepSeek-Coder-V2 ๊ธฐ์ ๋ณด๊ณ ์." https://arxiv.org/abs/2406.11931 โ DeepSeek-Coder V2 Lite์ MoE ์ํคํ ์ฒ ๋ฐ ์ฝ๋ฉ ๋ฒค์น๋งํฌ ๊ฒฐ๊ณผ.