Mac ๋ฉ๋ชจ๋ฆฌ ์ฉ๋๋ณ ๋ชจ๋ธ ์ถ์ฒ
์ต์ข ๊ฒ์ฆ: 2026-05-15. ์๋ก์ด ๋ชจ๋ธ ์ถ์์ ๋ฐ๋ผ ์ถ์ฒ ๋ชจ๋ธ์ด ๋ณ๊ฒฝ๋ ์ ์์ต๋๋ค. ์ด ํ์ด์ง๋ ๋ถ๊ธฐ๋ณ๋ก ์ ๋ฐ์ดํธ๋ฉ๋๋ค.
| ๋ฉ๋ชจ๋ฆฌ | ์ฃผ์ ์ถ์ฒ | ์์ํ | ํฌ๊ธฐ | M5 Pro tok/s | M5 Max tok/s | ๋์ |
|---|---|---|---|---|---|---|
| 16 GB | Phi-4 | Q4_K_M | 2.5 GB | 60โ70 | 110โ130 | Llama 3.3 8B Q4 (์ฌ์ ์์) |
| 36 GB | Llama 3.3 8B | Q8 | 8.5 GB | 38โ45 | 75โ85 | Qwen3 14B Q4 (8.5 GB) |
| 48 GB | Qwen3 14B | Q8 | 16 GB | 25โ30 | 50โ60 | Mixtral 8x22B Q4 (26 GB) |
| 64 GB | Qwen3 34B | Q5 | 24 GB | 18โ22 | 35โ42 | Mixtral 8x22B Q5 (32 GB) |
| 96 GB | Llama 3.3 70B | Q4 | 42 GB | 10โ13 | 20โ25 | Qwen3 72B Q4 (44 GB) |
| 128 GB | Llama 3.3 70B | Q5 | 49 GB | 8โ11 | 14โ18 | Qwen3 72B Q5 (51 GB) |
| 128 GB | Llama 3.3 70B | Q8 | 74 GB | N/A | 9โ12 | ์ต๊ณ ํ์ง, M5 Max ์ ์ฉ |
ํฌ๊ธฐ๋ GGUF ํ์ ๊ธฐ์ค์ ๋๋ค. MLX 4๋นํธ ๋๋ฑ ๋ชจ๋ธ์ ๋น์ทํ ํฌ๊ธฐ์ ๋๋ค.
๋ชจ๋ธ ํ์ง ๋ฒค์น๋งํฌ (2026 ํ์ค ํ ์คํธ)
| ๋ชจ๋ธ | MMLU | HumanEval | GSM8K | ํ๊ท | ๋น๊ณ |
|---|---|---|---|---|---|
| Phi-4 (3.8B) | 84.8 | 82.6 | 91.0 | 86.1 | ์ต๊ณ ์ ์ํ ๋ชจ๋ธ |
| Llama 3.3 8B | 73.0 | 72.6 | 84.5 | 76.7 | ์์ ์ ์ธ ๋ฒ์ฉ ๋ชจ๋ธ |
| Qwen3 14B | 79.7 | 83.5 | 90.2 | 84.5 | ๊ฐ๋ ฅํ ์ถ๋ก ์ฑ๋ฅ |
| Mistral Small | 60.1 | 30.5 | 50.0 | 46.9 | ๊ตฌํ์ด์ง๋ง ๋น ๋ฆ |
| Qwen3 34B | 83.3 | 88.4 | 93.0 | 88.2 | ์ต๊ณ ์ ์คํ ๋ชจ๋ธ |
| Mixtral 8x22B | 70.6 | 40.2 | 60.4 | 57.1 | MoE ์ํคํ ์ฒ |
| Llama 3.3 70B | 86.0 | 80.5 | 95.1 | 87.2 | ์ต๊ณ ์ ๋ฒ์ฉ ๋ชจ๋ธ |
| Qwen3 72B | 86.1 | 86.6 | 95.8 | 89.5 | ์ต๊ณ ์ ์ถ๋ก ์ฑ๋ฅ |
| Llama 3.3 405B | 88.6 | 89.0 | 96.8 | 91.5 | ๋ก์ปฌ ์คํ ๋ถ๊ฐ |
| GPT-5.5 (์ฐธ์กฐ) | 88.7 | 90.2 | 95.8 | 91.6 | ํด๋ผ์ฐ๋ ๊ธฐ์ค์ |
128GB Mac์์ Qwen3 72B๋ ์ถ๊ฐ ๋น์ฉ ์์ด GPT-5.5 ์์ค์ ํ์ง์ ๊ทผ์ ํฉ๋๋ค. ์ด๊ฒ์ด 2026๋ ๋ก์ปฌ AI ๋ถ์ผ์์ ๊ฐ์ฅ ์ค์ํ ๋ฐ์ ์ ๋๋ค.
์ฌ์ฉ ์ฌ๋ก๋ณ ์ต์ ๋ชจ๋ธ (2026)
| ์ฌ์ฉ ์ฌ๋ก | 36GB Mac ์ต์ | 64GB Mac ์ต์ | 128GB Mac ์ต์ |
|---|---|---|---|
| ์ฝ๋ฉ (์ผ๋ฐ) | Llama 3.3 8B | DeepSeek Coder V2 16B | Llama 3.3 70B |
| ์ฝ๋ฉ (Python) | DeepSeek Coder V2 Lite | DeepSeek Coder V2 16B | DeepSeek Coder V2 236B |
| ์ฅ๋ฌธ ๊ธ์ฐ๊ธฐ | Llama 3.3 8B Q8 | Qwen3 34B Q5 | Llama 3.3 70B Q5 |
| ์ฑํ / ๋ํ | Mistral Small | Mixtral 8x22B | Llama 3.3 70B |
| ์ถ๋ก / ์ํ | Qwen3 14B | Qwen3 34B | Qwen3 72B |
| RAG / Q&A | Llama 3.3 8B + nomic-embed | Llama 3.3 8B + bge-large | Llama 3.3 70B + bge-large |
| ๋น์ / ๋ฉํฐ๋ชจ๋ฌ | LLaVA 7B | Llama 3.2 Vision 11B | Llama 3.2 Vision 90B |
| ๋ฒ์ญ | Qwen3 14B | Qwen3 34B | Aya Expanse 32B |
| ์์ฝ | Llama 3.3 8B | Qwen3 34B | Llama 3.3 70B |
| ์ฝ๋ ๋ฆฌ๋ทฐ | DeepSeek Coder V2 Lite | DeepSeek Coder V2 16B | Llama 3.3 70B |
ํนํ ๋ชจ๋ธ์ ํน์ ์์ ์์ ๋ฒ์ฉ ๋ชจ๋ธ๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์ด๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. DeepSeek Coder๋ ๋ ํฐ Llama๋ณด๋ค ์ฝ๋ฉ์์ ์ฐ์ํ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค.
์ฌ์ฉ์ ์ ํ๋ณ ์ค์ ๊ตฌ์ฑ ์ฌ๋ก
๐กTip: ์ธ๋ ๊ฐ๋ฐ์ (Mac Mini M5 Pro 64GB, $1,200) - ์ฝ๋ฉ: DeepSeek Coder V2 Lite (16B Q4, 10 GB) - ๊ธ์ฐ๊ธฐ: ๋ฌธ์ ๋ฐ ์ด๋ฉ์ผ์ฉ Llama 3.3 8B Q8 (8.5 GB) - ์์ ์คํ: `OLLAMA_MAX_LOADED_MODELS=2`๋ก ๋ ๋ชจ๋ธ ์ ์ง - ์ผ์ผ ๋น์ฉ: $0 (Copilot + ChatGPT ์ $30~100 ๋๋น)
๐กTip: ๊ฐ์ธ์ ๋ณด ๋ณดํธ ์ค์ฌ ์ ๋ฌธ๊ฐ (MacBook Pro M5 Pro 48GB, $2,500) - ์ฃผ์: ์ผ๋ฐ ์ ๋ฌด์ฉ Llama 3.3 8B Q8 - ๋ฏผ๊ฐ ์ ๋ฌด: ๋ฒ๋ฅ /์๋ฃ/๊ธ์ต ๋ฌธ์์ฉ Qwen3 14B Q5 - ์ด๋ ์ค: ๋นํ๊ธฐ, ๋ณด์ ์์ค์์ ์คํ๋ผ์ธ ์ฌ์ฉ ๊ฐ๋ฅ - ๋ฐ์ดํฐ๊ฐ ๋ ธํธ๋ถ ์ธ๋ถ๋ก ์ ํ ์ ์ถ๋์ง ์์
๐กTip: ์ฐ๊ตฌ์ / ML ์์ง๋์ด (Mac Studio M5 Max 128GB, $4,000) - ์ฃผ์: ํ์ง ์ค์ฌ Llama 3.3 70B Q5 (49 GB) - ์ ๋ฌธ: ๋น์์ด๊ถ ์ฐ๊ตฌ์ฉ Qwen3 72B Q4 - ์ฝ๋ฉ: DeepSeek Coder V2 16B - ๋น์ : ๋ ผ๋ฌธ ๊ทธ๋ฆผ ๋ถ์์ฉ Llama 3.2 Vision 11B - ๋ค ๊ฐ์ง ๋ชจ๋ธ ๋์ ๋ก๋
๐กTip: ๊ฐ์ ์ฉ AI ์๋ฒ (Mac Mini M5 Pro 64GB, ์์ ๊ฐ๋) - ์์ฑ ์ด์์คํดํธ: Llama 3.3 8B + Whisper + Piper - RAG: ์๋ฒ ๋ฉ์ ํ์ฉํ ๊ฐ์กฑ ๋ฌธ์ Q&A - REST API๋ฅผ ํตํ ๊ฐ์กฑ ๊ตฌ์ฑ์ ์ฝ๋ฉ ์ง์ - ์ ๋ ฅ ๋น์ฉ: ์ฐ๊ฐ ์ฝ $35 - ๋์ฒด ํจ๊ณผ: 4์ธ ChatGPT Plus = ์ฐ๊ฐ $1,000
2026๋ ํผํด์ผ ํ ๋ชจ๋ธ ๋ฐ ์ด์
โ ๏ธWarning: Llama 3.3 (๋ชจ๋ ํฌ๊ธฐ) ์ฌ์ฉ ๊ธ์ง โ 2023๋ ์ถ์, Llama 3 ๋ฐ 3.1๋ก ๋์ฒด๋จ. ๋์ผ ํ๋ผ๋ฏธํฐ ์ ๋๋น ํ์ง์ด 30~50% ๋ฎ์. ๊ตฌํ ํํ ๋ฆฌ์ผ์ ์ฌ์ ํ ๋ฑ์ฅํ๋ฏ๋ก ๋ฐ๋ฅด์ง ๋ง์ญ์์ค. ๋์ฒด ๋ชจ๋ธ: Llama 3.3 8B.
โ ๏ธWarning: Vicuna, Alpaca, WizardLM ์ฌ์ฉ ๊ธ์ง โ 2023๋ ๋ ์ปค๋ฎค๋ํฐ ํ์ธํ๋ ๋ชจ๋ธ. ํ์ฌ ๋ฒ ์ด์ค ๋ชจ๋ธ(Llama 3.3, Qwen3)์ด ์ด๋ฏธ ๋๋ฑํ๊ฑฐ๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค. ๋์ฒด ๋ชจ๋ธ: Qwen3 14B ๋๋ Llama 3.3 8B.
โ ๏ธWarning: Falcon 180B ์ฌ์ฉ ๊ธ์ง โ ์๋น์์ฉ Apple Silicon์์ ์คํ ๋ถ๊ฐ. Llama 3.3 70B(๋ ์์)๊ฐ ์ฑ๋ฅ์ด ๋ ๋ฐ์ด๋ฉ๋๋ค. ๋์ฒด ๋ชจ๋ธ: Llama 3.3 70B Q5.
โ ๏ธWarning: ์๋น์ ํ๋์จ์ด์์ FP16 ์์ํ ์ฌ์ฉ ๊ธ์ง โ Llama 3.3 70B FP16 = 140 GB๋ก ์ด๋ค Mac์๋ ํ์ฌ ๋ถ๊ฐ. Q5 ๋๋น ํ์ง ํฅ์์ 1% ๋ฏธ๋ง. ๋์ฒด: Q4_K_M ๋๋ Q5_K_M.
โ ๏ธWarning: ์์ ๋ฒ ์ด์ค ๋ชจ๋ธ (instruct ๋ณํ ์์) ์ฌ์ฉ ๊ธ์ง โ ๋ฒ ์ด์ค ๋ชจ๋ธ์ ํ ์คํธ๋ฅผ ์์ฑํ์ง๋ง ์ง์๋ฅผ ๋ฐ๋ฅด์ง ์์ต๋๋ค. "-instruct" ๋๋ "-chat" ์ ๋ฏธ์ฌ๋ฅผ ํ์ธํ์ญ์์ค. ๋์ฒด: ๋์ผ ๋ชจ๋ธ์ instruct ๋ณํ.
โ ๏ธWarning: ํ๋ฐํ๊ฒ ๊ฐ๋ฐ๋์ง ์๋ ๋ชจ๋ธ ์ฌ์ฉ ๊ธ์ง โ StableLM, RedPajama, MPT, Pythia: ๊ฐ๋ฐ ์ค๋จ ๋๋ ์ ์ฒด ์ํ. ์ ๊ธฐ ์ ๋ฐ์ดํธ๋ฅผ ์ ๊ณตํ๋ Meta, Alibaba, Mistral, Microsoft์ ๋ชจ๋ธ์ ์ฌ์ฉํ์ญ์์ค.
๋ชจ๋ธ ํ์ ๋น ๋ฅธ ์ฐธ์กฐ
| ํ์ | ์ฌ์ฉ ๋๊ตฌ | ์๋ณธ ๋๋น ํฌ๊ธฐ |
|---|---|---|
| GGUF Q4_K_M | Ollama, llama.cpp | FP16์ ์ฝ 30% |
| GGUF Q5_K_M | Ollama, llama.cpp | FP16์ ์ฝ 35% |
| GGUF Q8_0 | Ollama, llama.cpp | FP16์ ์ฝ 50% |
| MLX 4๋นํธ | MLX ํ๋ ์์ํฌ | FP16์ ์ฝ 30% |
| MLX 8๋นํธ | MLX ํ๋ ์์ํฌ | FP16์ ์ฝ 50% |
| FP16 (์๋ณธ) | ๋ชจ๋ ํ๋ ์์ํฌ | 100% |
์ด ๋ฌธ์์ ํฌ๊ธฐ๋ ๋ณ๋ ๋ช ์๊ฐ ์๋ ํ GGUF Q4_K_M ๊ธฐ์ค์ ๋๋ค. MLX 4๋นํธ ๋๋ฑ ๋ชจ๋ธ์ ํฌ๊ธฐ๊ฐ ๋น์ทํฉ๋๋ค. ์ ํํ ๋ฐ์ดํธ ์๋ HuggingFace์ ๋ชจ๋ธ ์นด๋๋ฅผ ํ์ธํ์ญ์์ค.
๋น ๋ฅธ ์ฐธ์กฐ: ๋ชจ๋ธ ๋ค์ด๋ก๋ ๋ฐฉ๋ฒ
# 16 GB Mac
ollama pull phi4
# 36 GB Mac (ํ๋ ์ ํ)
ollama pull llama3.1:8b
ollama pull qwen2.5:14b
ollama pull mistral:7b
# 64 GB Mac
ollama pull qwen2.5:34b
ollama pull mixtral:8x7b
# 128 GB Mac
ollama pull llama3.1:70b
ollama pull qwen2.5:72b
# ํนํ ๋ชจ๋ธ
ollama pull deepseek-coder-v2:16b # ์ฝ๋ฉ
ollama pull llama3.2-vision:11b # ๋น์
ollama pull aya-expanse:32b # ๋ฒ์ญ๋ ๊ฐ์ง ๋ชจ๋ธ์ ๋์์ ์คํํ ์ ์์ต๋๊น?
์, ํ๊ฒฝ ๋ณ์์ `OLLAMA_MAX_LOADED_MODELS=2`๋ฅผ ์ค์ ํ์ญ์์ค. 64GB์์๋ 8B์ 34B ๋ชจ๋ธ์ ๋์์ ์คํํ ์ ์์ต๋๋ค.
์ด๋ณด์์๊ฒ ๊ฐ์ฅ ์ข์ ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น?
Llama 3.3 8B์ ๋๋ค. ๊ด๋ฒ์ํ๊ฒ ์ ๊ณต๋๋ฉฐ ์ถ๋ ฅ ํ์ง์ด ์ฐ์ํ๊ณ ๊ฒ์ฆ๋ ์ค์ ์ ๋ณด์ ํ๊ณ ์์ต๋๋ค. M1 ์ด์์ ๋ชจ๋ Mac์์ ์คํ๋ฉ๋๋ค.
Mixtral 8x22B๋ Llama 8B๋ณด๋ค ๋น ๋ฆ ๋๊น?
์๋๋๋ค. M5 Pro ๊ธฐ์ค ์ฝ๊ฐ ๋๋ฆฝ๋๋ค(40~50 tok/s ๋ 50~60 tok/s). ๊ทธ๋ฌ๋ ์ถ๋ก ์ฑ๋ฅ์ ๋ ๋ฐ์ด๋ฉ๋๋ค.
2026๋ ์ต๊ณ ์ ๋ก์ปฌ LLM์ ๋ฌด์์ ๋๊น?
Apple Silicon ๋๋ถ๋ถ์ ์ฌ์ฉ์์๊ฒ๋ Qwen3(Mac์ ๋ง๋ ํฌ๊ธฐ)์ด ํ์ง ๋ฒค์น๋งํฌ์์ ํ์ฌ ์ ๋์ ๋๋ค. 128GB Mac์์๋ Llama 3.3 70B๊ฐ ๋น์ทํ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค. 16GB ๋ฏธ๋ง์ ๊ฒฝ์ฐ Phi-4๊ฐ 3.8B ํ๋ผ๋ฏธํฐ๋ก 2024๋ 8B ๋ชจ๋ธ์ ํ์ ํ๋ ๋๋ผ์ด ์ฑ๋ฅ์ ๋ณด์ ๋๋ค.
Mac์์ Llama 3.3 405B๋ฅผ ์คํํ ์ ์์ต๋๊น?
์๋๋๋ค. Llama 3.3 405B๋ Q4 ์์ํ์์๋ 200GB ์ด์์ด ํ์ํ๋ฏ๋ก ์ด๋ค ์๋น์์ฉ Mac์๋ ์ถฉ๋ถํ ํตํฉ ๋ฉ๋ชจ๋ฆฌ๊ฐ ์์ต๋๋ค. M5 Ultra(2026๋ ์ค๋ฐ ์์, 256 GB)๋ฅผ ๊ธฐ๋ค๋ฆฌ์ญ์์ค โ ์ด๊ฒ์ด Q3~Q4์์ 405B๋ฅผ ์คํํ ์ ์๋ ์ฒซ ๋ฒ์งธ ์๋น์์ฉ ํ๋์จ์ด๊ฐ ๋ ๊ฒ์ ๋๋ค.
Qwen์ด ๋ก์ปฌ ์ฌ์ฉ์์ Llama๋ณด๋ค ๋ซ์ต๋๊น?
๋๋ถ๋ถ์ ์์ ์์ Qwen3๋ ๋์ผ ํ๋ผ๋ฏธํฐ ์ ๊ธฐ์ค ๋ฒค์น๋งํฌ์์ Llama 3.3๋ณด๋ค ์ฝ๊ฐ ์์ ์์ต๋๋ค(MMLU์์ 1~3์ ์ฐจ์ด). Llama๋ ๋ ๋์ ์ปค๋ฎค๋ํฐ ์ง์๊ณผ ๋ ๋ง์ ํ์ธํ๋ ๋ชจ๋ธ์ ๋ณด์ ํ๊ณ ์์ต๋๋ค. ๋๋ถ๋ถ์ ์ฌ์ฉ์๋ ์ฐจ์ด๋ฅผ ์ฒด๊ฐํ๊ธฐ ์ด๋ ค์ฐ๋ฏ๋ก ๊ฐ์ฉ์ฑ๊ณผ ํ์ธํ๋ ์ํ๊ณ๋ฅผ ๊ธฐ์ค์ผ๋ก ์ ํํ์ญ์์ค.
์ค์ ๋ก ์ ์ฉํ ์ต์ ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น?
ํ๋ผ๋ฏธํฐ 3.8B์ Phi-4์ ๋๋ค. MMLU ์ ์ 84.8๋ก ์ผ๋ถ 2024๋ 8B ๋ชจ๋ธ์ ํ์ ํฉ๋๋ค. ์ฑํ ๊ณผ Q&A์์ ๋๋๋๋ก ์ ๋ฅํฉ๋๋ค. ์ฝ๋ฉ์ด๋ ๋ณต์กํ ์ถ๋ก ์๋ Llama 3.3 8B ๋๋ Qwen3 14B๋ก ์ด๋ํ์ญ์์ค.