Key Takeaways
- ์ฝ๋ฉ: Qwen 3.6 27B๊ฐ SWE-bench์์ ์ ๋(77.2% ์ค์ธ๊ณ, ์ต๊ณ ๋ฐ์ง ๋ชจ๋ธ). ์์ด์ ํฑ ์ฝ๋ฉ: Mistral Devstral Small 24B. IDE ์๋์์ฑ: Mistral Codestral 22B.
- ์ผ๋ฐ ์ถ๋ก : Llama 3.3 70B์ Qwen3 72B๋ ๊ฑฐ์ ๋๋ฑํฉ๋๋ค. Llama 3.x๋ ์์ด์์, Qwen์ ๋ค๊ตญ์ด์์ ๊ฐ์ธ๋ฅผ ๋ณด์ ๋๋ค.
- ํจ์จ์ฑ(GB๋น ํ์ง): Mistral Small 3.1 24B๋ 14 GB RAM์ผ๋ก 70B๊ธ์ ๊ฐ๊น์ด ํ์ง์ ์ ๊ณตํฉ๋๋ค. 4์ ์ดํ ๋ณ๋ ์์.
- ์์ด ์ด์ธ ์ธ์ด: Qwen3๋ 29๊ฐ ์ธ์ด๋ฅผ ๊ธฐ๋ณธ ์ง์ํฉ๋๋ค. Llama์ Mistral์ ์ฃผ๋ก ์์ด์ ์ต์ ํ๋์ด ์์ต๋๋ค.
- MoE ์ฅ๋ฌธ ์ปจํ ์คํธ(2026๋ ์ ๊ท): Llama 4 Scout(17B ํ์ฑ/109B ์ ์ฒด, 16๊ฐ ์ ๋ฌธ๊ฐ, ๋ฉํฐ๋ชจ๋ฌ)๋ 10M ํ ํฐ ์ปจํ ์คํธ๋ฅผ ์ ๊ณตํ์ง๋ง Q4์์ ~55 GB VRAM์ด ํ์ํฉ๋๋ค. ์ผ๋ฐ ์์ํ์์๋ 24 GB ์๋น์์ฉ GPU์ ๋ง์ง ์์ต๋๋ค(1.78๋นํธ์์๋ง ๊ฐ๋ฅ, ~20 tok/s).
- ๋ ๊ฑฐ์ ๋ชจ๋ธ๋ ์ฌ์ ํ ๊ด๋ จ์ฑ: Mistral Small 24B, Qwen 3 14B, Llama 3.3 8B๋ ์ฌ์ ํ ๊ด๋ฒ์ํ๊ฒ ๋ฐฐํฌ๋๊ณ ์์ต๋๋ค. ์๋์ "๋ ๊ฑฐ์ ๋ฒค์น๋งํฌ ์ฐธ์กฐ" ์น์ ์์ ์ ๊ทธ๋ ์ด๋ ์๊ธฐ์ ์ ์ง ์๊ธฐ๋ฅผ ๋ค๋ฃน๋๋ค.
โขInfo: ๐ ์ด์ ๋น๊ต๋ฅผ ์ฐพ๊ณ ๊ณ์ ๊ฐ์? ์๋์ Mistral 24B vs Qwen 3 14B vs Llama 3.3 8B ๋ ๊ฑฐ์ ๋ฒค์น๋งํฌ๋ก ๋ฐ๋ก ์ด๋ํ์ธ์.
์ด๋ ์คํ์จ์ดํธ ๋ชจ๋ธ ํจ๋ฐ๋ฆฌ๋ฅผ ์ ํํด์ผ ํ ๊น์?
์ด์ ์ธ๋ ๋ชจ๋ธ(Qwen3, Llama 3.3)์ Ollama์์ ๊ณ์ ์ด์ฉ ๊ฐ๋ฅํ๋ฉฐ ์ฌ์ ํ ๋๋ฆฌ ์ฌ์ฉ๋ฉ๋๋ค. ์ด ๋น๊ต๋ ํ์ฌ ์ธ๋ ๋ชจ๋ธ์ ์ค์ ์ ๋ก๋๋ค. ์คํ ์ค๋น๊ฐ ๋์ จ๋์? Qwen ๋ก์ปฌ ์ ์ฒด ์ค์น ๊ฐ์ด๋ โ
| Family | Developer | Current Releases | Licence |
|---|---|---|---|
| Qwen3 | Alibaba | Qwen3 (2026๋ 4์), Qwen 3.5 (๋ฉํฐ๋ชจ๋ฌ), Qwen 3.6 27B (SWE-bench 77.2%) | Apache 2.0 (๋๋ถ๋ถ์ ํฌ๊ธฐ) |
| Llama 4 | Meta | Scout (17B ํ์ฑ/109B MoE, 16๊ฐ ์ ๋ฌธ๊ฐ, 10M ์ปจํ ์คํธ, ๋ฉํฐ๋ชจ๋ฌ, ~55 GB VRAM Q4), Maverick (17B ํ์ฑ/400B MoE), ๋ ๊ฑฐ์: 3.3 70B | Llama Community (๋ง์ถคํ) |
| Mistral | Mistral AI | Small 3.1 (24B), Devstral Small 24B (์์ด์ ํฑ), Codestral 22B (FIM/IDE) | Apache 2.0 (๋๋ถ๋ถ์ ํฌ๊ธฐ) |
์ด ๋ชจ๋ธ๋ค์ ๋ฒค์น๋งํฌ์์ ์ด๋ป๊ฒ ๋น๊ต๋ ๊น์?
SWE-bench(์ค์ธ๊ณ GitHub ์ด์ ํด๊ฒฐ)๋ ์ค์ฉ์ ์ธ ์ฝ๋ฉ ํ๊ฐ๋ฅผ ์ํ 2026๋ ์ฃผ์ ์ฝ๋ฉ ๋ฒค์น๋งํฌ์ ๋๋ค. ์ด๋ ๋ค์ค ํ์ผ ๋ณ๊ฒฝ, ์ฝ๋๋ฒ ์ด์ค ์ดํด, ํ ์คํธ ์์ฑ์ ํ ์คํธํฉ๋๋ค. HumanEval(๋จ์ผ ํจ์ Python)์ ๋น๊ต์ ์ ์ฉํ์ง๋ง ๋ถ์ฐจ์ ์ ๋๋ค. MMLU์ MATH๋ ์ผ๋ฐ ์ง์๊ณผ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํฉ๋๋ค. Llama 4 Scout ๋ฒค์น๋งํฌ๋ ์ต๊ทผ ์ถ์์ MoE ๋ณต์ก์ฑ์ผ๋ก ์ธํด ์ ํ์ ์ ๋๋ค. ๋์๋ ์์ง ๋ฐํ๋์ง ์์๊ฑฐ๋ ํด๋น๋์ง ์๋ ๋ฒค์น๋งํฌ๋ฅผ ๋ํ๋ ๋๋ค.
| Model | MMLU | SWE-bench | MATH | RAM (Q4_K_M) |
|---|---|---|---|---|
| Qwen 3.6 27B | ~83% | 77.2% | ~80% | 16 GB |
| Qwen3 72B | ~85% | โ | ~84% | 43 GB |
| Llama 4 Scout 17B (MoE) | โ | โ | โ | ~55 GB |
| Llama 3.3 70B (๋ ๊ฑฐ์) | 82% | โ | 77% | 40 GB |
| Mistral Small 3.1 24B | 79% | โ | 65% | 14 GB |
| Devstral Small 24B | โ | ๋์(์์ด์ ํฑ) | โ | 16 GB |
| Qwen3 8B | ~75% | โ | ~55% | 5 GB |
| Mistral Small v0.3 | 64% | โ | 28% | 4.5 GB |
Qwen3 / Qwen 3.6์ ์ด๋ค ์์ ์์ ํ์ํ๊ฐ์?
Alibaba์ Qwen3(2026๋ 4์)์ Qwen 3.6(2026๋ 5์)์ ์ฝ๋ฉ ๋ฒค์น๋งํฌ์์ ์ ๋๋ฅผ ๋ฌ๋ฆฌ๊ณ ์์ต๋๋ค. Qwen 3.6 27B๋ SWE-bench์์ 77.2%๋ฅผ ๊ธฐ๋กํ๋ฉฐ, ์ด์ฉ ๊ฐ๋ฅํ ์ต๊ณ ์ ๋ฐ์ง ์ฝ๋ฉ ๋ชจ๋ธ์ ๋๋ค. Qwen3 72B๋ MMLU์์ ~85%๋ก ๊ณ์ ์ ๋๋ฅผ ์ ์งํฉ๋๋ค. Qwen 3.5๋ ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ๋ฅ์ ์ถ๊ฐํฉ๋๋ค. Qwen3 ํจ๋ฐ๋ฆฌ์๋ ๋ฐ์ง ๋ชจ๋ธ๊ณผ MoE ๋ณํ(35B-A3B)์ด ๋ชจ๋ ํฌํจ๋ฉ๋๋ค.
๊ฐ์ : ์ฝ๋ฉ(Python, JavaScript, SQL, SWE-bench ์ ๋), ์ํ์ ์ถ๋ก (72B์์ 84% MATH), 29๊ฐ ์ธ์ด ๊ธฐ๋ณธ ์ง์, JSON ๋ชจ๋, ํจ์ ํธ์ถ, ๋ชจ๋ ํฌ๊ธฐ์์ 128K ์ปจํ ์คํธ ์๋์ฐ.
์ฝ์ : ์์ด ์ง์ ๋ฐ๋ฅด๊ธฐ ์คํ์ผ์ด Llama๋ Mistral๋ณด๋ค ๋ ์์ฐ์ค๋ฝ๊ฒ ๋๊ปด์ง ์ ์์ต๋๋ค. ์ผ๋ถ ์ฌ์ฉ์๋ ์์ด ์ฐฝ์ ๊ธ์ฐ๊ธฐ๊ฐ ๋ ์ ์ฐฝํ๋ค๊ณ ๋ณด๊ณ ํฉ๋๋ค. ์คํ ์จ์ดํธ์์๋ ๋ถ๊ตฌํ๊ณ Alibaba ์ถ์ฒ๋ก ์ธํด ์ผ๋ถ ๊ธฐ์ ์ฌ์ฉ์๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ ์ฐ๋ ค๋ฅผ ํํฉ๋๋ค.
Llama 4 Scout๊ฐ ์ฅ๋ฌธ ์ปจํ ์คํธ ์ ํ์ง์ธ ์ด์ ๋?
Llama 4(2025๋ 4์)๋ Llama ํจ๋ฐ๋ฆฌ์ MoE ์ํคํ ์ฒ๋ฅผ ๋์ ํ์ต๋๋ค. Scout(17B ํ์ฑ/109B ์ ์ฒด, 16๊ฐ ์ ๋ฌธ๊ฐ, ๋ฉํฐ๋ชจ๋ฌ)๋ 1000๋ง ํ ํฐ ์ปจํ ์คํธ ์๋์ฐ๋ฅผ ์ ๊ณตํฉ๋๋ค. ๋ก์ปฌ์์ ์คํ ๊ฐ๋ฅํ ๋ชจ๋ธ ์ค ๊ฐ์ฅ ํฐ ์ปจํ ์คํธ์ด์ง๋ง Q4์์ ~55 GB VRAM์ด ํ์ํ๋ฉฐ, ์ผ๋ฐ ์์ํ์์๋ 24 GB ์๋น์์ฉ GPU์ ๋ง์ง ์์ต๋๋ค(1.78๋นํธ์์๋ง ๊ฐ๋ฅ, ~20 tok/s). Maverick(17B ํ์ฑ/400B ์ ์ฒด)์ ๋ฉํฐ GPU ์ค์ ์ ๋์์ผ๋ก ํฉ๋๋ค. Llama 3.3 70B๋ ์ฌ์ ํ ๊ฐ์ฅ ๊ฒ์ฆ๋ ๋ฐ์ง ๋ชจ๋ธ์ ๋๋ค. ์๋น์์ฉ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ ๋ Qwen 3.6 27B(Q4์์ 24 GB ํ์ฌ)๊ฐ Scout๋ฅผ ๋ฅ๊ฐํฉ๋๋ค. Scout์ 1000๋ง ์ปจํ ์คํธ๋ ๋ฉํฐ๋ชจ๋ฌ ์ ๋ ฅ์ด ํ์ํ ๋ Scout๋ฅผ ์ ํํ์ญ์์ค.
๊ฐ์ : 1000๋ง ์ปจํ ์คํธ ์๋์ฐ(Scout), ๋ฉํฐ๋ชจ๋ฌ ์ ๋ ฅ, ๊ฐ์ฅ ๊ฐ๋ ฅํ ์์ด ์ง์ ๋ฐ๋ฅด๊ธฐ ๋ฐ ์ฐฝ์ ๊ธ์ฐ๊ธฐ, ์คํ์์ค ํจ๋ฐ๋ฆฌ ์ค ๊ฐ์ฅ ๋์ ์ํ๊ณ ์ง์, Llama 3.3 70B ์ฌ์ ํ ๊ด๋ฒ์ํ๊ฒ ๋ฏธ์ธ ์กฐ์ ์ค.
์ฝ์ : ๋์ VRAM ์๊ตฌ๋(Q4์์ ~55 GB)์ผ๋ก Scout๋ ์ผ๋ฐ ์์ํ์์ ๋จ์ผ 24 GB ์๋น์์ฉ GPU๋ก ์คํ ๋ถ๊ฐ. ๊ธฐ๋ณธ ๋ค๊ตญ์ด ์ง์ ์์(Qwen3๊ฐ ๋น์์ด ๋ถ์ผ์์ ํฌ๊ฒ ์์ฌ). Llama 4 Scout ๋ฒค์น๋งํฌ ์์ง ์์ง ์ค. Llama 3.3 70B์ Llama 3.3 8B๋ ์ฌ์ ํ ์ด์ฉ ๊ฐ๋ฅํ๋ฉฐ ๊ฐ์ฅ ๊ด๋ฒ์ํ๊ฒ ๋ฏธ์ธ ์กฐ์ ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๋๋ค.
Mistral์ ๊ฐ์ฅ ํฐ ์ฅ์ ์ ๋ฌด์์ธ๊ฐ์?
Mistral AI๋ ์ด ๋น๊ต์์ ๊ฐ์ฅ ํ๋ผ๋ฏธํฐ ํจ์จ์ ์ธ ๋ชจ๋ธ์ ์์ฐํ๋ฉฐ ์ด์ ์ ๋ฌธํ๋ ๋ณํ์ ์ ๊ณตํฉ๋๋ค. Mistral Small 3.1 24B๋ 14 GB RAM๋ง ํ์ํ๋ฉด์ 70B๊ธ์ ๊ฐ๊น์ด ๋ฒค์น๋งํฌ ์ ์๋ฅผ ๋ฌ์ฑํฉ๋๋ค. ์ต๊ณ ์ RAM ๋๋น ํ์ง ๋น์จ์ ๋๋ค. Devstral Small 24B(Mistral AI, 2026)๋ ์์ด์ ํฑ ์ฝ๋ฉ(๋ค์ค ํ์ผ ํธ์ง, ํด ํธ์ถ, ๋๋ฒ๊น ๋ฃจํ)์ ์ํด ํน๋ณํ ์ ์๋์์ต๋๋ค. Codestral 22B๋ IDE ์๋์์ฑ์ ์ํด FIM์ ์ต์ ํ๋ Mistral์ ๋ชจ๋ธ๋ก, Continue.dev ๋ฐ Cursor ํตํฉ์ ๊ถ์ฅ๋ฉ๋๋ค.
๊ฐ์ : ์ต๊ณ RAM ๋๋น ํ์ง ๋น์จ(Small 3.1), ์์ด์ ํฑ ์ฝ๋ฉ์ฉ Devstral, IDE/FIM์ฉ Codestral, ๊ฐ๋ ฅํ ํจ์ ํธ์ถ ๋ฐ ํด ์ฌ์ฉ, ์ฃผ์ ๋ชจ๋ธ์ ๊น๋ํ Apache 2.0 ๋ผ์ด์ ์ค, EU AI Act ์ค์๋ฅผ ์ํ ์ ๋ฝ ์ถ์ฒ(ํ๋์ค).
์ฝ์ : Mistral Small v0.3๋ ์ด์ Qwen3 7B ๋ฐ Llama 3.3 8B์ ๋ฒค์น๋งํฌ์์ ๋ฐ๋ฆฝ๋๋ค. Qwen์ด๋ Llama๋ณด๋ค ํ๋ฐํฐ์ด์์ ํฌ๊ธฐ ์ต์ ์ด ์ ์ต๋๋ค(๋จ, ์ ๋ฌธํ๊ฐ ๋ถ๋ถ์ ์ผ๋ก ์ด๋ฅผ ๋ณด์).
ํด ํธ์ถ ๋ฐ ์ถ๋ก ๋น๊ต
ํด ํธ์ถ(ํจ์ ํธ์ถ)์ ํตํด ๋ชจ๋ธ์ ์์ด์ ํฑ ์ํฌํ๋ก์ฐ์์ ์ธ๋ถ API์ ๋๊ตฌ๋ฅผ ํธ์ถํ ์ ์์ต๋๋ค. 2026๋ 4์ ๊ธฐ์ค, ์ธ ํจ๋ฐ๋ฆฌ ๋ชจ๋ ์ด๋ฅผ ๊ธฐ๋ณธ ์ง์ํฉ๋๋ค.
| Model | Tool Calling | Reasoning (MATH) | Best For |
|---|---|---|---|
| Qwen3 72B | โ ๊ธฐ๋ณธ ์ง์ | 83% | ๋ณต์กํ ๋ค๋จ๊ณ ์์ด์ ํธ |
| Llama 3.3 70B | โ ๊ธฐ๋ณธ ์ง์ | 77% | ์์ด ์์ฃผ ์์ด์ ํธ ์ํฌํ๋ก์ฐ |
| Mistral Small 3.1 24B | โ ๊ธฐ๋ณธ ์ง์, ๊ฒ์ฆ๋จ | 65% | 16 GB์์ ํ๋ก๋์ ํด ์ฌ์ฉ |
| Qwen3 14B | โ ๊ธฐ๋ณธ ์ง์ | 70% | ๋น์ฉ ํจ์จ์ ์ธ ํด ํธ์ถ |
| Llama 3.2 3B | โ ๊ธฐ๋ณธ ์ง์ | 51% | ๊ฒฝ๋ ์์ด์ ํธ |
| Mistral Small v0.3 | โ ๏ธ ์ ํ์ | 28% | ํด ์ฌ์ฉ ๋น๊ถ์ฅ |
์ถ๋ก ์ง์ค ์์ (์ํ, ๋ ผ๋ฆฌ, ์ฝ๋ ๋ฆฌ๋ทฐ)์ ๊ฒฝ์ฐ: DeepSeek-R1(MIT ๋ผ์ด์ ์ค, 7B-32B)์ด MATH ๋ฒค์น๋งํฌ์์ ์ธ ํจ๋ฐ๋ฆฌ ๋ชจ๋๋ฅผ ๋ฅ๊ฐํฉ๋๋ค. ๋ถ์ ์ํฌํ๋ก์ฐ์์๋ ์ด ์ธ ๋ชจ๋ธ๊ณผ ํจ๊ป ๊ณ ๋ คํ์ญ์์ค.
์์ ๋ณ๋ก ์ด๋ ๋ชจ๋ธ ํจ๋ฐ๋ฆฌ๊ฐ ์ด๊ธฐ๋์?
๋ชจ๋ธ ์ ํ์ ์ฒซ ๋ฒ์งธ ๋จ๊ณ์ด๊ณ , ํ๋กฌํํธ ์ค๊ณ๊ฐ ๋ ๋ฒ์งธ ๋จ๊ณ์ ๋๋ค. ๋์ผํ ํ๋กฌํํธ๋ Qwen, Llama, Mistral์์ ํฌ๊ฒ ๋ค๋ฅธ ๊ฒฐ๊ณผ๋ฅผ ๋ผ ์ ์์ต๋๋ค. ์ด๋ ๋ชจ๋ธ ํจ๋ฐ๋ฆฌ์์๋ ์ผ๊ด๋ ๊ฒฐ๊ณผ๋ฅผ ์ป๊ธฐ ์ํ ์ฒด๊ณ์ ์ธ ๊ธฐ๋ฒ์ ํ๋กฌํํธ ์์ง๋์ด๋ง ๊ฐ์ด๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
| Task | Winner | Why |
|---|---|---|
| Python/JavaScript ์ฝ๋ฉ(์์ฑ) | Qwen 3.6 | 77.2% SWE-bench โ ์ต๊ณ ๋ฐ์ง ์ฝ๋ฉ ๋ชจ๋ธ |
| ์์ด์ ํฑ ์ฝ๋ฉ(๋ค์ค ํ์ผ, ๋๋ฒ๊น ) | Mistral (Devstral) | ์์ด์ ํฑ ์ํฌํ๋ก์ฐ๋ฅผ ์ํด ํน๋ณ ์ ์๋จ |
| IDE ์๋์์ฑ(FIM) | Mistral (Codestral) | FIM ์ต์ ํ, Continue.dev/Cursor ์ง์ |
| ์ผ๋ฐ Q&A(์์ด) | Llama 3.3 / Qwen3(๋๋ฅ ) | 70B์์ 82-85% MMLU ๋์ |
| ์ํ์ ์ถ๋ก | Qwen3 | 72B์์ 84% MATH ๋ Llama 3.3 70B์ 77% |
| ์์ด ์ด์ธ ์ธ์ด | Qwen3 | 29๊ฐ ๊ธฐ๋ณธ ์ธ์ด; Llama์ Mistral์ ์์ด ์์ฃผ |
| ์ฐฝ์ ๊ธ์ฐ๊ธฐ(์์ด) | Llama 3.x/4 | ๋ ์์ฐ์ค๋ฌ์ด ์์ด ์์ฑ ์คํ์ผ |
| 16 GB RAM์์ ํ์ง | Mistral Small 3.1 | 14 GB RAM์์ 70B๊ธ ํ์ง โ ๋ณ๋ ์์ |
| ์ฅ๋ฌธ ์ปจํ ์คํธ ์์ (10M+ ํ ํฐ) | Llama 4 Scout | 10M ํ ํฐ ์ปจํ ์คํธ ์๋์ฐ โ ๊ฒฝ์์ ์์ |
| ์ ๋ฌธ์ ์ฒซ ๋ชจ๋ธ | Llama 4 3B | ๊ฐ์ฅ ์ ๋ฌธ์ํ๋จ, ๊ฐ์ฅ ๋ง์ ์ปค๋ฎค๋ํฐ ์ง์ โ ๋ณ๋ ์์ |
๊ฐ์ ๊ท๋ชจ์์ ๋ชจ๋ธ๋ค์ ์ด๋ป๊ฒ ๋น๊ต๋ ๊น์?
3B-4B๊ธ: Qwen3 3B์ Phi-4 Mini 3.8B๋ ์ฝ๋ฉ๊ณผ ์ํ์์ Llama 4 3B๋ฅผ ๋ฅ๊ฐํฉ๋๋ค. ์ผ๋ฐ ์์ด ์ฌ์ฉ์๋ Llama 4 3B๊ฐ ๋ ์ ๋ขฐํ ์ ์์ต๋๋ค.
7B-8B๊ธ: Qwen3 8B(~5 GB)์ Llama 3.3 8B(~5.5 GB) ๋ชจ๋ Mistral Small v0.3๋ฅผ ํฌ๊ฒ ๋ฅ๊ฐํฉ๋๋ค. Qwen3 8B๋ ์ฝ๋ฉ์์ ์ ๋์ด๊ณ , Llama 3.3 8B๋ ์์ด ์ง์ ๋ฐ๋ฅด๊ธฐ์์ ์ ๋์ ๋๋ค.
14B-24B๊ธ: Qwen3 14B์ Mistral Small 3.1 24B๊ฐ ์ฃผ์ ์ต์ ์ ๋๋ค. Mistral Small 3.1์ด ๋ ๋ง์ RAM์ ์๊ตฌํ์ง๋ง ์ ๋ฐ์ ์ผ๋ก ๋ ๊ฐ๋ ฅํฉ๋๋ค. Devstral Small 24B๋ ์ด ํฐ์ด์์ ์์ด์ ํฑ ์ฝ๋ฉ์ ํ๋ ๊ฐ๋ฐ์์๊ฒ ์ต์ ์ ์ ํ์ ๋๋ค.
MoE๊ธ(2025-2026๋ ์ ๊ท): Llama 4 Scout(17B ํ์ฑ/109B ์ ์ฒด, 16๊ฐ ์ ๋ฌธ๊ฐ)์ Qwen3.6-35B-A3B(3B ํ์ฑ/35B ์ ์ฒด, 73.4 SWE-bench)๋ Mixture-of-Experts ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ํ ํฐ๋น ํ๋ผ๋ฏธํฐ์ ์ผ๋ถ๋ง ํ์ฑํ๋ฉ๋๋ค. Scout๋ Q4์์ ~55 GB VRAM์ด ํ์ํฉ๋๋ค(24 GB GPU์๋ 1.78๋นํธ์์๋ง ๋ง๊ณ , ~20 tok/s). ๋ฐ๋ผ์ ์๋น์ VRAM ํจ์จ๋ณด๋ค๋ ์ฅ๋ฌธ ์ปจํ ์คํธ/๋ฉํฐ๋ชจ๋ฌ ์ ํ์ง์ ๋๋ค. ๋ ์์ MoE ๋ณํ์ ํจ์ฌ VRAM ์นํ์ ์ ๋๋ค. gpt-oss:20b(21B ์ ์ฒด/3.6B ํ์ฑ MoE)๋ ์กฐ์ ๊ฐ๋ฅํ ์ถ๋ก ์ผ๋ก ~o3-mini ์์ค์์ 16 GB์์ ์คํ๋ฉ๋๋ค.
70B-72B๊ธ: Llama 3.3 70B์ Qwen3 72B๋ 2026๋ ๋ก์ปฌ์์ ์คํ ๊ฐ๋ฅํ ์ต๊ณ ์ ๋ฐ์ง ๋ชจ๋ธ์ ๋๋ค. ์ฝ๋ฉ๊ณผ ๋ค๊ตญ์ด๋ Qwen3 72B๋ฅผ, ์์ด ์์ฃผ ์ผ๋ฐ ์์ ์ Llama 3.3 70B๋ฅผ ์ ํํ์ญ์์ค.
Qwen, Llama, Mistral์ ์คํ์์ค ํ๊ฒฝ์ ์์ฐ๋ฆ ๋๋ค. ์์ ์ ๋์(GPT-5.5, Claude Opus 4.8, Gemini 3.5)์ ํฌํจํ ๋น๊ต์ ์คํ์์ค ๋๋น ๋ ์ ์ ํ ๊ธฐ์ค์ ์ฌ๋ฐ๋ฅธ AI ๋ชจ๋ธ ์ ํ ๋ฐฉ๋ฒ์ ์ฐธ์กฐํ์ญ์์ค.
Mistral Small 24B vs Qwen 3 14B vs Llama 3.3 8B: ๋ ๊ฑฐ์ ๋ฒค์น๋งํฌ ์ฐธ์กฐ
๋ง์ ๊ฐ๋ฐ์๋ค์ด ์ฌ์ ํ ์ด์ ์ธ๋๋ฅผ ์คํํฉ๋๋ค: Mistral Small 24B(2024), Qwen 3 14B(2024), Llama 3.3 8B(2024). ์ด ๋ชจ๋ธ๋ค์ Ollama์์ ๊ณ์ ์ด์ฉ ๊ฐ๋ฅํ๋ฉฐ ํ๋ก๋์ ์์ ๊ด๋ฒ์ํ๊ฒ ๋ฐฐํฌ๋๊ณ ์์ต๋๋ค. ์ด ์น์ ์์๋ ์์ง ์ ๊ทธ๋ ์ด๋ํ์ง ์์ ํ์ ์ํด ์ง์ ๋น๊ตํ๊ณ , Qwen 3, Llama 4 ๋๋ ํ์ฌ Mistral๋ก ์ ๊ทธ๋ ์ด๋ํ๋ ๊ฒ์ด ์ ์ ํ ์๊ธฐ๋ฅผ ์ค๋ช ํฉ๋๋ค.
- Mistral Small 24B๋ ์ธ ๋ชจ๋ธ ์ค ๊ฐ์ฅ ๋์ ์ ๋ ๋ฒค์น๋งํฌ๋ฅผ ๋ฌ์ฑํ์ง๋ง 14 GB RAM์ด ํ์ํฉ๋๋ค. ํ์ง์ด ์ฌ์ ๊ณต๊ฐ๋ณด๋ค ์ค์ํ 16 GB+ ๋จธ์ ์ ์ต์ ์ ๋๋ค.
- Qwen 3 14B๋ ์ด ๋ ๊ฑฐ์ ํฐ์ด์์ ๊ฐ์ฅ ๊ฐ๋ ฅํ ์ฝ๋ฉ ๋ชจ๋ธ๋ก, 8 GB RAM์์ 71% HumanEval์ ๊ธฐ๋กํฉ๋๋ค. ์ฝ๋ ์์ฑ์ ์ฐ์ ์ํ๋ 12-16 GB RAM ๊ฐ๋ฐ์์๊ฒ ์ต์ ์ ๋๋ค.
- Llama 3.3 8B๋ ๊ฐ์ฅ ๋์ ์ํ๊ณ ์ง์์ ๊ฐ์ถ๊ณ ์์ต๋๋ค. ๊ฐ์ฅ ๋ง์ ํ์ธํ๋, ๊ฐ์ฅ ๋ง์ ํํ ๋ฆฌ์ผ, ๊ฐ์ฅ ๋ง์ ์ปค๋ฎค๋ํฐ ๋์. ์ฒ์ ์ฌ์ฉ์๋ ๊ด๋ฒ์ํ ์ปค๋ฎค๋ํฐ ์์์ด ํ์ํ ํ์ ์ต์ ์ ๋๋ค.
- Mistral Small 24B โ Mistral Small 3.1 24B ์ ๊ทธ๋ ์ด๋ ์๊ธฐ: ์์ด์ ํฑ ์ฝ๋ฉ์ด ํ์ํ ๊ฒฝ์ฐ(Devstral Small 24B ์ฌ์ฉ), IDE ์๋์์ฑ(Codestral 22B ์ฌ์ฉ), ๋๋ ๋์ผํ RAM ๋ฐ์๊ตญ์์ ์ ์ง์ ์ธ ํ์ง ๊ฐ์ ์ด ํ์ํ ๊ฒฝ์ฐ.
- Qwen 3 14B โ Qwen 3 14B ๋๋ Qwen 3.6 27B ์ ๊ทธ๋ ์ด๋ ์๊ธฐ: SWE-bench ์ฑ๋ฅ์ด ํ์ํ ๊ฒฝ์ฐ(Qwen 3.6 27B๋ 77.2%๋ก 2026๋ ์ต๊ณ ๋ฐ์ง ์ฝ๋ฉ ๋ชจ๋ธ), ์ด๋ฏธ 16 GB RAM์ ์๊ฑฐ๋, 29๊ฐ ์ธ์ด ๊ธฐ๋ณธ ์ง์์ด ํ์ํ ๊ฒฝ์ฐ(Qwen 3 ํ์ฅ ๋ค๊ตญ์ด ์ปค๋ฒ๋ฆฌ์ง).
- Llama 3.3 8B โ Llama 4 Scout ์ ๊ทธ๋ ์ด๋ ์๊ธฐ: Q4์์ ~55 GB+ VRAM์ด ์๋ ๊ฒฝ์ฐ์๋ง(Scout์ 16๊ฐ ์ ๋ฌธ๊ฐ MoE๋ 17B/109B ํ๋ผ๋ฏธํฐ๋ฅผ ํ์ฑํํ์ง๋ง Q4์์ ~55 GB๊ฐ ํ์ํ๊ณ , 1.78๋นํธ์์๋ง 24 GB GPU์ ๋ง์, ~20 tok/s) ๊ทธ๋ฆฌ๊ณ 10M ํ ํฐ ์ปจํ ์คํธ(Llama 3.3์ 128K ๋๋น) ๋๋ ๋ฉํฐ๋ชจ๋ฌ ์ ๋ ฅ์ด ํ์ํ ๊ฒฝ์ฐ. ๋จ์ผ 24 GB ์๋น์์ฉ GPU์์๋ Qwen 3.6 27B(Q4์์ 24 GB ํ์ฌ)๊ฐ ๋ ๋์ ์ ๊ทธ๋ ์ด๋์ ๋๋ค.
- ๋ ๊ฑฐ์ ๋ชจ๋ธ ์ ์ง ์๊ธฐ: ํ์ธํ๋์ด Llama 3.3 8B ๋๋ Qwen 3์ ๊ตฌ์ถ๋ ๊ฒฝ์ฐ(๋ง์ด๊ทธ๋ ์ด์ ๋น์ฉ > ์ด์ต), ํ๋ก๋์ ์์ ์ฑ์ด ๋ฒค์น๋งํฌ๋ณด๋ค ์ค์ํ ๊ฒฝ์ฐ(๋ ๊ฑฐ์ ๋ชจ๋ธ์ ๊ฒ์ฆ๋จ), ๋๋ ์ํฌ๋ก๋์ ์๋ก์ด ๊ธฐ๋ฅ์ด ํ์ํ์ง ์์ ๊ฒฝ์ฐ(์ผ๋ฐ ์ฑํ , ์์ฝ, ๊ธฐ๋ณธ Q&A).
- ๋ ๊ฑฐ์ ์ฌ์ฉ์๋ฅผ ์ํ ๋น ๋ฅธ ๊ฒฐ์ ๋งคํธ๋ฆญ์ค:
- โข RAM 8 GB, ์ผ๋ฐ ์ฑํ : Llama 3.3 8B ๋๋ Mistral Small v0.3 ์ ์ง.
- โข RAM 12-16 GB, ์ฝ๋ฉ: Qwen 3 14B โ Qwen 3 14B ๋๋ Qwen 3.6 27B ์ ๊ทธ๋ ์ด๋.
- โข RAM 16+ GB, ์ต๊ณ ํ์ง ์ํจ: Mistral 24B โ Mistral Small 3.1 24B(์ผ๋ฐ) ๋๋ Devstral 24B(์์ด์ ํฑ ์ฝ๋ฉ) ์ ๊ทธ๋ ์ด๋.
- โข VRAM 24 GB: Qwen 3.6 27B(Q4์์ 24 GB ํ์ฌ) ์ฌ์ฉ โ ์๋น์์ฉ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ . Llama 4 Scout(MoE, 10M ์ปจํ ์คํธ, Q4์์ ~55 GB)๋ ์ฅ๋ฌธ ์ปจํ ์คํธ๋ ๋ฉํฐ๋ชจ๋ฌ ์ ๋ ฅ์ด ํ์ํ ๋ฉํฐ GPU ๋๋ ์ํฌ์คํ ์ด์ ๋ฆฌ๊ทธ์ฉ.
| Model | Parameters | RAM (Q4_K_M) | MMLU | HumanEval | Best For |
|---|---|---|---|---|---|
| Mistral Small 24B | 24B ๋ฐ์ง | 14 GB | 79% | 73% | ์ต๊ณ RAM ๋๋น ํ์ง(๋ ๊ฑฐ์ ํฐ์ด) |
| Qwen 3 14B | 14B ๋ฐ์ง | 8 GB | 73% | 71% | ์ค๊ธ ํ๋์จ์ด์์ ์ฝ๋ฉ |
| Llama 3.3 8B | 8B ๋ฐ์ง | 5 GB | 68% | 65% | ๊ฐ์ฅ ๋ฌธ์ํ๋จ, ๊ฐ์ฅ ์ฌ์ด ์์ |
์ง์ญ๋ณ ๋งฅ๋ฝ: EU, ์ผ๋ณธ, ์ค๊ตญ์ ๋ง๋ ํจ๋ฐ๋ฆฌ
EU ๋ฐ GDPR ์ค์: ์ธ ๋ชจ๋ธ ํจ๋ฐ๋ฆฌ(Qwen3, Llama 3.x/4, Mistral) ๋ชจ๋ ์ธ๋ถ ๋ฐ์ดํฐ ์ ์ก ์์ด ์์ ํ ๋ก์ปฌ์์ ์คํ๋์ด GDPR ์ค์๋ฅผ ๋ณด์ฅํฉ๋๋ค. Mistral(ํ๋์ค ์ถ์ฒ, Mistral AI)์ ๊ฐ์ฅ ๊ฐ๋ ฅํ EU ์ค์ ํ์ธ๋ฅผ ๊ฐ์ถ๊ณ ์์ต๋๋ค. Devstral Small 24B์ Codestral 22B๋ ํ๋์ค ์ถ์ฒ(Mistral AI), Apache 2.0 โ ์ด์ฉ ๊ฐ๋ฅํ ๊ฐ์ฅ ๊ฐ๋ ฅํ EU ์ถ์ฒ ์ฝ๋ฉ ๋ชจ๋ธ์ ๋๋ค. Qwen3(Apache 2.0)์ Llama 3.x/4 ๋ชจ๋ EU AI Act ํฌ๋ช ์ฑ ๋ฐ ์คํ์์ค ๊ฐ์ฌ ๊ฐ๋ฅ์ฑ ์๊ตฌ ์ฌํญ์์ ๋๋ฑํ๊ฒ ์๋ํฉ๋๋ค. Qwen3๋ ๋ ์ผ์ด, ํ๋์ค์ด ๋ฑ EU ์ธ์ด๋ฅผ ํ์ง ์ ํ ์์ด ๊ธฐ๋ณธ ์ง์ํฉ๋๋ค. 2026๋ 8์ EU AI Act ๊ธฐํ์ ์ด ๋ชจ๋ธ ํฐ์ด์ ๋ถ๋ฅ์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
์ผ๋ณธ ๋ฐ METI ์ค์: Qwen3์ Llama 3.x/4 ๋ชจ๋ ์ผ๋ณธ ๊ฒฝ์ ์ฐ์ ์ฑ(METI) ๋ก์ปฌ AI ๊ฑฐ๋ฒ๋์ค ์ง์นจ์ ๋ถํฉํฉ๋๋ค. ์ผ๋ณธ ๊ธฐ์ ๋คํธ์ํฌ ๋ด ๋น๊ณต๊ฐ ์ธํ๋ผ์์ ๋ฐฐํฌํ๋ฉด ํน๋ณ ๋ณด๊ณ ๊ฐ ํ์ ์์ต๋๋ค. Qwen3๋ 29๊ฐ ์ธ์ด ์ค ์ผ๋ณธ์ด๋ฅผ ๊ฐ๋ ฅํ๊ฒ ์ง์ํ์ฌ(๊ธฐ๋ณธ ํ ํฐํ) ์ผ๋ณธ์ด ์ํฌ๋ก๋์์ ์ ํธ๋ฉ๋๋ค. Mistral๋ ์ค์ํ์ง๋ง ์ผ๋ณธ AI ๊ฑฐ๋ฒ๋์ค ๋งฅ๋ฝ์์ ๋ ๋ฌธ์ํ๋์ด ์์ต๋๋ค. Llama 4 Scout์ MoE ํจ์จ์ฑ์ ํ๋์จ์ด ์ ์ฝ์ด ์๋ ์ผ๋ณธ ๊ธฐ์ ์๊ฒ ๋งค๋ ฅ์ ์ ๋๋ค.
์ค๊ตญ ๋ฐ CAC ์๊ตฌ ์ฌํญ: Qwen3(Alibaba, ๊ตญ๋ด)๋ ์ธํฐ๋ท์ ๋ณดํ๊ณต์ค(CAC) ์ค์์ ๊ฐ๋ ฅํ๊ฒ ์ ํธ๋ฉ๋๋ค. Qwen3๋ 29๊ฐ ์ธ์ด ์ง์์์ ํ์ง ์ ํ ์์ด ์ค๊ตญ์ด ํ ํฐํ์ ๊ธฐ๋ณธ ์ต์ ํ๋์ด ์์ต๋๋ค. ํ์ค์ด ๋ฐ ๋ฐฉ์ธ ์ง์์ ์ค์ํ ์ฅ์ ์ ๋๋ค. Kimi K2.6(Moonshot AI, 1T ์ ์ฒด/32B ํ์ฑ MoE, Modified MIT ๋ผ์ด์ ์ค)๋ ์ค๊ตญ ๊ธฐ์ ์ฝ๋ฉ์ ์ด์ฉ ๊ฐ๋ฅํฉ๋๋ค. ํ๋ฐํฐ์ด ์ฑ๋ฅ(58.6 SWE-Bench Pro), Modified MIT ๋ผ์ด์ ์ค. Llama์ Mistral์ ์ค๊ตญ ์ํ ๋ด ๋น๊ณต๊ฐ ์๋ฒ์์ ๋ฐฐํฌํ๋ฉด ํ์ฉ๋์ง๋ง, ํด๋ผ์ฐ๋ API ํธ์ถ์ ๋ ์๊ฒฉํ CAC ์ฌ์ฌ์ ๋ฐ์ดํฐ ๊ฑฐ์ฃผ์ง ์๊ตฌ ์ฌํญ์ด ๋ฐ์ํฉ๋๋ค. ์ฝํ ์ธ ๋ชจ๋๋ ์ด์ ์ค์๋ฅผ ์ํด Qwen3์ ์ค๊ตญ์ด ํ๋ จ ์ ์ฐ์ ํ์ง ์ฝํ ์ธ ์ ์ฑ ๊ณผ์ ์ผ์น๋ฅผ ๋ณด์ฅํฉ๋๋ค.
๋ชจ๋ธ ํจ๋ฐ๋ฆฌ ์ ํ ์ ํํ ์ค์
- ๋ค๋ฅธ ํ๋ผ๋ฏธํฐ ์์์ ๋ชจ๋ธ ๋น๊ต โ Qwen 32B vs Llama 70B๋ ๋๋ฑํ ๋น๊ต๊ฐ ์๋๋๋ค.
- MoE VRAM ์ค๋ . Llama 4 Scout๋ 109B ์ด ํ๋ผ๋ฏธํฐ์ด์ง๋ง ํ ํฐ๋น 17B๋ง ํ์ฑํ๋ฉ๋๋ค. ๊ทธ๋ฌ๋ Q4์์ ์ฌ์ ํ ~55 GB VRAM์ด ํ์ํฉ๋๋ค(๋ชจ๋ ์ ๋ฌธ๊ฐ๊ฐ ์์ฃผํด์ผ ํจ). 17B ๋ฐ์ง ๋ชจ๋ธ์ด ์ฌ์ฉํ ~14 GB๊ฐ ์๋๋๋ค. ์ผ๋ฐ ์์ํ์์๋ 24 GB ์๋น์์ฉ GPU์ ๋ง์ง ์์ต๋๋ค(1.78๋นํธ์์๋ง ๊ฐ๋ฅ, ~20 tok/s). ํ์ฑ ํ๋ผ๋ฏธํฐ ์๊ฐ ์๋ ์ค์ VRAM ๋ฐ์๊ตญ๊ณผ ๋ฒค์น๋งํฌ๋ก ๋น๊ตํ์ญ์์ค.
- Qwen3๋ฅผ ์ฌ์ฉํ ์ ์์ ๋ ์ด์ ๋ฒ์ Qwen3 ์ฌ์ฉ. Qwen3 8B๋ ์ฝ๋ฉ ๋ฒค์น๋งํฌ์์ Qwen3 7B๋ฅผ ๊ฐ์ ํฉ๋๋ค. Qwen3์ ๊ตฌ์ถ๋ ํน์ ํ์ธํ๋์ด ์๋ค๋ฉด Qwen3๋ก ์ ๊ทธ๋ ์ด๋ํ์ญ์์ค.
- ์์ ๋ณ Mistral ๋ชจ๋ธ์ ๊ณ ๋ คํ์ง ์์. Mistral์ ์ด์ ์ธ ๊ฐ์ง ๋ณ๊ฐ์ ๋ชจ๋ธ ๋ผ์ธ์ ๊ฐ์ต๋๋ค: Small 3.1(์ผ๋ฐ), Devstral(์์ด์ ํฑ ์ฝ๋ฉ), Codestral(IDE ์๋์์ฑ). ์ด๋ค ์์ ์ ์ด๋ค ๋ชจ๋ธ์ ์ฌ์ฉํ ์ง ์ง์ ํ์ง ์๊ณ "Mistral"์ ์ ํํ๋ฉด ํจ๋ฐ๋ฆฌ์ ์ฃผ์ ์ฅ์ ์ธ ์ ๋ฌธํ๋ฅผ ๋ญ๋นํ๊ฒ ๋ฉ๋๋ค.
- ์ํฌ๋ก๋๊ฐ ๋ค๊ตญ์ด์ธ ๊ฒฝ์ฐ ๋ชจ๋ธ ์ ํ ์ ๋ค๊ตญ์ด ๋ฒค์น๋งํฌ๋ฅผ ๋ฌด์ํจ.
- Mistral Small 3.1 ๊ฐ๊ณผ: ๋ง์ ์ฌ์ฉ์๋ค์ด Small 3.1(24B)์ด 30+ GB RAM์ ์๊ตฌํ๋ค๊ณ ์๊ฐํด ๊ฑด๋๋๋๋ค. Q5 ์์ํ์์ 22 GB์ ๋ง์ผ๋ฉฐ, ๋ง์ ์์ ์์ Llama 3.3 8B๋ฅผ ๋ฅ๊ฐํฉ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
Qwen๊ณผ Llama ์ค ์ ์ฌ์ฉ ์ฌ๋ก์ ์ด๋ ๊ฒ์ด ๋ ์ข๋์?
์๋น์์ฉ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ : Qwen 3.6 27B(77.2% SWE-bench, Q4์์ 24 GB ํ์ฌ). ์ฝ๋ฉ๊ณผ ๋ค๊ตญ์ด ์์ : Qwen 3.6 27B ๋๋ Qwen3 8B. ์ฅ๋ฌธ ์ปจํ ์คํธ(10M ํ ํฐ) ๋๋ ๋ฉํฐ๋ชจ๋ฌ ์ ๋ ฅ: Llama 4 Scout(Q4์์ ~55 GB VRAM ํ์). GB๋น ์ต๋ ํ์ง: Mistral Small 3.1. ์ค์ ์ํฌ๋ก๋์ ์ํ ํ๋กฌํํธ๋ก ํ ์คํธํ์ญ์์ค.
Llama 4 Scout๊ฐ ๋ฌด์์ด๊ณ Llama 3.3๊ณผ ์ด๋ป๊ฒ ๋ค๋ฅธ๊ฐ์?
Llama 4 Scout๋ 16๊ฐ ์ ๋ฌธ๊ฐ Mixture-of-Experts(MoE) ์ํคํ ์ฒ๋ฅผ ์ฌ์ฉํฉ๋๋ค. 109B ์ ์ฒด ํ๋ผ๋ฏธํฐ ์ค ํ ํฐ๋น 17B๊ฐ ํ์ฑํ๋๋ฉฐ ๋ฉํฐ๋ชจ๋ฌ์ ๋๋ค. ๋ชจ๋ ์ ๋ฌธ๊ฐ๊ฐ ์์ฃผํด์ผ ํ๋ฏ๋ก Q4์์ ~55 GB VRAM์ด ํ์ํฉ๋๋ค(17B ๋ฐ์ง ๋ชจ๋ธ์ด ์ฌ์ฉํ ~14 GB๊ฐ ์๋). ์ผ๋ฐ ์์ํ์์๋ 24 GB ์๋น์์ฉ GPU์ ๋ง์ง ์์ต๋๋ค. 1.78๋นํธ์์๋ง ๊ฐ๋ฅ(~20 tok/s). ์ฅ์ ์ 10M ํ ํฐ ์ปจํ ์คํธ ์๋์ฐ๋ก, ๋ก์ปฌ์์ ์คํ ๊ฐ๋ฅํ ๋ชจ๋ธ ์ค ๊ฐ์ฅ ํฝ๋๋ค. Llama 3.3 70B๋ ๋ฐ์ง ๋ชจ๋ธ(40 GB). ๋จ์ผ 24 GB GPU์์๋ Qwen 3.6 27B๊ฐ ๋ ๋์ ์ ๋ฐ์ ์ ํ์ด๊ณ , VRAM์ด ์์ผ๋ฉด์ ์ฅ๋ฌธ ์ปจํ ์คํธ๋ ๋ฉํฐ๋ชจ๋ฌ ์ ๋ ฅ์ด ํ์ํ ๋ Scout๋ฅผ ์ ํํ์ญ์์ค.
Qwen3์ Qwen3 ์ค ์ด๋ ๊ฒ์ ์ฌ์ฉํด์ผ ํ๋์?
์ ํ๋ก์ ํธ์๋ Qwen3๋ฅผ ์ฌ์ฉํ์ญ์์ค. Qwen3 8B๋ ์ฝ๋ฉ ๋ฐ ์ถ๋ก ๋ฒค์น๋งํฌ์์ Qwen3 7B๋ฅผ ๊ฐ์ ํฉ๋๋ค. Qwen 3.6 27B(77.2% SWE-bench)๋ ์ด์ฉ ๊ฐ๋ฅํ ์ต๊ณ ์ ๋ฐ์ง ์ฝ๋ฉ ๋ชจ๋ธ์ ๋๋ค. Qwen3์ ์์กดํ๋ ๊ธฐ์กด ํ์ธํ๋์ด๋ ์ํฌํ๋ก์ฐ๊ฐ ์๋ ๊ฒฝ์ฐ์๋ง ์ ์งํ์ญ์์ค. ์ ์ค์น์๋ ํญ์ Qwen3๋ก ์์ํ์ญ์์ค.
Mistral์ ์๋น์์ฉ ํ๋์จ์ด์์ ์ผ๋ง๋ ๋น ๋ฅธ๊ฐ์?
Mistral Small 3.1(24B)์ ๊ฐ์ ํ๋์จ์ด์์ Llama 3.3 8B๋ณด๋ค 1.5-2๋ฐฐ ๋น ๋ฆ ๋๋ค. ์ฒ๋ฆฌ๋์ด ์ค์ํ ์ํฌ๋ก๋์์ Mistral Small์ ๋จ์ผ GPU์์ 40-60 tok/s๋ก ๊ฐ์ฅ ๋น ๋ฆ ๋๋ค. Codestral 22B๋ IDE ์๋์์ฑ ์ํฌํ๋ก์ฐ์์ FIM(fill-in-the-middle)์ ์ต์ ํ๋์ด ์์ต๋๋ค.
์ธ ๋ชจ๋ธ ๋ชจ๋ 8 GB VRAM์์ ์คํ๋๋์?
๋ค, ๋ชจ๋ 8 GB์์ Q4 ์์ํ๋ก 7B ๋ชจ๋ธ์ ์คํํ ์ ์์ต๋๋ค. Qwen3 8B๋ ~5 GB, Llama 3.3 8B๋ ~5.5 GB, Mistral Small์ Q4_K_M์์ ~4.5 GB๋ฅผ ์ฌ์ฉํฉ๋๋ค. Llama 4 Scout(MoE)๋ 8 GB์ ๋ง์ง ์์ต๋๋ค. Q4์์ ~55 GB VRAM์ด ํ์ํฉ๋๋ค.
RTX 5090์ด ํ์ํ๊ฐ์?
์๋น์์ฉ ์ ํ์๋ ํ์ํ์ง ์์ต๋๋ค. RTX 5070(12 GB)์ผ๋ก 7B ๋ชจ๋ธ์ ํธ์ํ๊ฒ ์คํํฉ๋๋ค. 24 GB GPU๋ก Q4์์ Qwen 3.6 27B๋ฅผ ์คํํ ์ ์์ต๋๋ค(์๋น์์ฉ ํ๋์จ์ด ์ ๋ฐ ์ต๊ณ ). Llama 4 Scout๋ Q4์์ ~55 GB๊ฐ ํ์ํ๋ฉฐ, ๋จ์ผ ์๋น์์ฉ ์นด๋๊ฐ ์๋ ๋ฉํฐ GPU ๋๋ ์ํฌ์คํ ์ด์ ๋ฆฌ๊ทธ์ ๋๋ค. RTX 5090์ 70B+ ๋ฐ์ง ๋ชจ๋ธ์ ์คํํ์ง ์๋ ํ ๊ณผ๋ํฉ๋๋ค.
์ด๋ค ์์ํ๋ฅผ ์ฌ์ฉํด์ผ ํ๋์?
Q4_K_M(4๋นํธ)๋ก ์์ํ์ญ์์ค. ๋ชจ๋ ํ๋์จ์ด์์ ํ์ง๊ณผ ์๋์ ์ข์ ๊ท ํ์ ๋๋ค. VRAM ์ฌ์ ๊ฐ ์๊ณ ๋ ๋์ ํ์ง์ด ํ์ํ๋ฉด Q5_K_M์ ์ฌ์ฉํ์ญ์์ค. ์ ํ๋ ์ฅ์น์๋ Q3_K_S.
์ฝ๋ฉ์ ์ด๋ ๊ฒ์ด ์ต๊ณ ์ธ๊ฐ์?
8GB ํฐ์ด: Qwen3 8B(~76% HumanEval). ์ต๊ณ ๋ฐ์ง ์ฝ๋ฉ: Qwen 3.6 27B(77.2% SWE-bench). ์์ด์ ํฑ ๋ค์ค ํ์ผ ์ํฌํ๋ก์ฐ: Devstral Small 24B. IDE ์๋์์ฑ(FIM): Codestral 22B.
์ถ์ฒ
- Qwen ํ. (2026). Qwen3 ๊ธฐ์ ๋ณด๊ณ ์. โ Qwen3 ํจ๋ฐ๋ฆฌ ๋ฒค์น๋งํฌ, Qwen 3.6 27B SWE-bench(77.2%), MoE ๋ณํ.
- Meta AI. (2025). Llama 4 ๋ชจ๋ธ ์นด๋. โ Llama 4 Scout/Maverick MoE, 10M ์ปจํ ์คํธ ์๋์ฐ์ ๊ณต์ ๋ฒค์น๋งํฌ ๋ฐ ์ํคํ ์ฒ.
- Mistral AI. (2026). Devstral Small 24B. โ ์์ด์ ํฑ ์ฝ๋ฉ ๋ชจ๋ธ์ ์ํคํ ์ฒ ๋ฐ ๋ฒค์น๋งํฌ.
- Mistral AI. (2025). Codestral. โ IDE ์๋์์ฑ์ ์ํ FIM ์ต์ ํ ์ฝ๋ฉ ๋ชจ๋ธ.
- Meta AI. (2024). Llama 3.3 ๋ชจ๋ธ ์นด๋. โ Llama 3.3 70B์ ๊ณต์ ๋ฒค์น๋งํฌ ๋ฐ์ดํฐ(๋ ๊ฑฐ์, ์ฌ์ ํ ๋๋ฆฌ ์ฌ์ฉ๋จ).
์ ๋ฐ์ดํธ ๋ก๊ทธ
- 2026-05-17: Mistral Small 24B, Qwen 3 14B, Llama 3.3 8B๋ฅผ ๋น๊ตํ๋ ๋ ๊ฑฐ์ ๋ฒค์น๋งํฌ ์ฐธ์กฐ ์น์ ์ถ๊ฐ. ๋ ๊ฑฐ์ ๋ฐ ํ์ฌ ๋ชจ๋ธ ๊ฒ์์ ์ฐ๊ฒฐํ๋๋ก ์ ๋ชฉ ์ ๋ฐ์ดํธ.