Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/Apple Silicon ์ตœ์  LLM ๋ชจ๋ธ 2026: 16GB, 36GB, 64GB, 128GB๋ณ„ ์ถ”์ฒœ
ํ•˜๋“œ์›จ์–ด & ์„ฑ๋Šฅ

Apple Silicon ์ตœ์  LLM ๋ชจ๋ธ 2026: 16GB, 36GB, 64GB, 128GB๋ณ„ ์ถ”์ฒœ

ยท10๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

16GB: Phi-4. 36GB: Llama 3.3 8B Q8 (~38 tok/s). 64GB: Qwen3 34B Q5 (~18 tok/s). 128GB: Llama 3.3 70B Q5 (~14 tok/s M5 Pro, ~16 tok/s M5 Max). ๋ชจ๋‘ Metal ๊ธฐ๋ฐ˜ Ollama๋ฅผ ํ†ตํ•ด ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.

Apple Silicon Mac ๋ฉ”๋ชจ๋ฆฌ ์šฉ๋Ÿ‰๋ณ„ ๋กœ์ปฌ LLM ๋ชจ๋ธ ์ถ”์ฒœ์ž…๋‹ˆ๋‹ค. 16GB(Phi-4), 36GB(Llama 3.3 8B), 64GB(Qwen2 34B), 128GB(Llama 3.3 70B)์— ๋Œ€ํ•œ ๊ตฌ์ฒด์ ์ธ ๋ชจ๋ธ ์„ ํƒ๊ณผ M5 Pro/Max์—์„œ์˜ tok/s ์„ฑ๋Šฅ ์ˆ˜์น˜๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

Mac ๋ฉ”๋ชจ๋ฆฌ ์šฉ๋Ÿ‰๋ณ„ ๋ชจ๋ธ ์ถ”์ฒœ

์ตœ์ข… ๊ฒ€์ฆ: 2026-05-15. ์ƒˆ๋กœ์šด ๋ชจ๋ธ ์ถœ์‹œ์— ๋”ฐ๋ผ ์ถ”์ฒœ ๋ชจ๋ธ์ด ๋ณ€๊ฒฝ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ํŽ˜์ด์ง€๋Š” ๋ถ„๊ธฐ๋ณ„๋กœ ์—…๋ฐ์ดํŠธ๋ฉ๋‹ˆ๋‹ค.

๋ฉ”๋ชจ๋ฆฌ์ฃผ์š” ์ถ”์ฒœ์–‘์žํ™”ํฌ๊ธฐM5 Pro tok/sM5 Max tok/s๋Œ€์•ˆ
16 GBPhi-4Q4_K_M2.5 GB60โ€“70110โ€“130Llama 3.3 8B Q4 (์—ฌ์œ  ์—†์Œ)
36 GBLlama 3.3 8BQ88.5 GB38โ€“4575โ€“85Qwen3 14B Q4 (8.5 GB)
48 GBQwen3 14BQ816 GB25โ€“3050โ€“60Mixtral 8x22B Q4 (26 GB)
64 GBQwen3 34BQ524 GB18โ€“2235โ€“42Mixtral 8x22B Q5 (32 GB)
96 GBLlama 3.3 70BQ442 GB10โ€“1320โ€“25Qwen3 72B Q4 (44 GB)
128 GBLlama 3.3 70BQ549 GB8โ€“1114โ€“18Qwen3 72B Q5 (51 GB)
128 GBLlama 3.3 70BQ874 GBN/A9โ€“12์ตœ๊ณ  ํ’ˆ์งˆ, M5 Max ์ „์šฉ

ํฌ๊ธฐ๋Š” GGUF ํ˜•์‹ ๊ธฐ์ค€์ž…๋‹ˆ๋‹ค. MLX 4๋น„ํŠธ ๋™๋“ฑ ๋ชจ๋ธ์€ ๋น„์Šทํ•œ ํฌ๊ธฐ์ž…๋‹ˆ๋‹ค.

๋ชจ๋ธ ํ’ˆ์งˆ ๋ฒค์น˜๋งˆํฌ (2026 ํ‘œ์ค€ ํ…Œ์ŠคํŠธ)

๋ชจ๋ธMMLUHumanEvalGSM8Kํ‰๊ท ๋น„๊ณ 
Phi-4 (3.8B)84.882.691.086.1์ตœ๊ณ ์˜ ์†Œํ˜• ๋ชจ๋ธ
Llama 3.3 8B73.072.684.576.7์•ˆ์ •์ ์ธ ๋ฒ”์šฉ ๋ชจ๋ธ
Qwen3 14B79.783.590.284.5๊ฐ•๋ ฅํ•œ ์ถ”๋ก  ์„ฑ๋Šฅ
Mistral Small60.130.550.046.9๊ตฌํ˜•์ด์ง€๋งŒ ๋น ๋ฆ„
Qwen3 34B83.388.493.088.2์ตœ๊ณ ์˜ ์ค‘ํ˜• ๋ชจ๋ธ
Mixtral 8x22B70.640.260.457.1MoE ์•„ํ‚คํ…์ฒ˜
Llama 3.3 70B86.080.595.187.2์ตœ๊ณ ์˜ ๋ฒ”์šฉ ๋ชจ๋ธ
Qwen3 72B86.186.695.889.5์ตœ๊ณ ์˜ ์ถ”๋ก  ์„ฑ๋Šฅ
Llama 3.3 405B88.689.096.891.5๋กœ์ปฌ ์‹คํ–‰ ๋ถˆ๊ฐ€
GPT-5.5 (์ฐธ์กฐ)88.790.295.891.6ํด๋ผ์šฐ๋“œ ๊ธฐ์ค€์„ 

128GB Mac์—์„œ Qwen3 72B๋Š” ์ถ”๊ฐ€ ๋น„์šฉ ์—†์ด GPT-5.5 ์ˆ˜์ค€์˜ ํ’ˆ์งˆ์— ๊ทผ์ ‘ํ•ฉ๋‹ˆ๋‹ค. ์ด๊ฒƒ์ด 2026๋…„ ๋กœ์ปฌ AI ๋ถ„์•ผ์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๋ฐœ์ „์ž…๋‹ˆ๋‹ค.

์‚ฌ์šฉ ์‚ฌ๋ก€๋ณ„ ์ตœ์  ๋ชจ๋ธ (2026)

์‚ฌ์šฉ ์‚ฌ๋ก€36GB Mac ์ตœ์ 64GB Mac ์ตœ์ 128GB Mac ์ตœ์ 
์ฝ”๋”ฉ (์ผ๋ฐ˜)Llama 3.3 8BDeepSeek Coder V2 16BLlama 3.3 70B
์ฝ”๋”ฉ (Python)DeepSeek Coder V2 LiteDeepSeek Coder V2 16BDeepSeek Coder V2 236B
์žฅ๋ฌธ ๊ธ€์“ฐ๊ธฐLlama 3.3 8B Q8Qwen3 34B Q5Llama 3.3 70B Q5
์ฑ„ํŒ… / ๋Œ€ํ™”Mistral SmallMixtral 8x22BLlama 3.3 70B
์ถ”๋ก  / ์ˆ˜ํ•™Qwen3 14BQwen3 34BQwen3 72B
RAG / Q&ALlama 3.3 8B + nomic-embedLlama 3.3 8B + bge-largeLlama 3.3 70B + bge-large
๋น„์ „ / ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌLLaVA 7BLlama 3.2 Vision 11BLlama 3.2 Vision 90B
๋ฒˆ์—ญQwen3 14BQwen3 34BAya Expanse 32B
์š”์•ฝLlama 3.3 8BQwen3 34BLlama 3.3 70B
์ฝ”๋“œ ๋ฆฌ๋ทฐDeepSeek Coder V2 LiteDeepSeek Coder V2 16BLlama 3.3 70B

ํŠนํ™” ๋ชจ๋ธ์€ ํŠน์ • ์ž‘์—…์—์„œ ๋ฒ”์šฉ ๋ชจ๋ธ๋ณด๋‹ค ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. DeepSeek Coder๋Š” ๋” ํฐ Llama๋ณด๋‹ค ์ฝ”๋”ฉ์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•ฉ๋‹ˆ๋‹ค.

์‚ฌ์šฉ์ž ์œ ํ˜•๋ณ„ ์‹ค์ œ ๊ตฌ์„ฑ ์‚ฌ๋ก€

๐Ÿ’กTip: ์ธ๋”” ๊ฐœ๋ฐœ์ž (Mac Mini M5 Pro 64GB, $1,200) - ์ฝ”๋”ฉ: DeepSeek Coder V2 Lite (16B Q4, 10 GB) - ๊ธ€์“ฐ๊ธฐ: ๋ฌธ์„œ ๋ฐ ์ด๋ฉ”์ผ์šฉ Llama 3.3 8B Q8 (8.5 GB) - ์ƒ์‹œ ์‹คํ–‰: `OLLAMA_MAX_LOADED_MODELS=2`๋กœ ๋‘ ๋ชจ๋ธ ์œ ์ง€ - ์ผ์ผ ๋น„์šฉ: $0 (Copilot + ChatGPT ์›” $30~100 ๋Œ€๋น„)

๐Ÿ’กTip: ๊ฐœ์ธ์ •๋ณด ๋ณดํ˜ธ ์ค‘์‹ฌ ์ „๋ฌธ๊ฐ€ (MacBook Pro M5 Pro 48GB, $2,500) - ์ฃผ์š”: ์ผ๋ฐ˜ ์—…๋ฌด์šฉ Llama 3.3 8B Q8 - ๋ฏผ๊ฐ ์—…๋ฌด: ๋ฒ•๋ฅ /์˜๋ฃŒ/๊ธˆ์œต ๋ฌธ์„œ์šฉ Qwen3 14B Q5 - ์ด๋™ ์ค‘: ๋น„ํ–‰๊ธฐ, ๋ณด์•ˆ ์‹œ์„ค์—์„œ ์˜คํ”„๋ผ์ธ ์‚ฌ์šฉ ๊ฐ€๋Šฅ - ๋ฐ์ดํ„ฐ๊ฐ€ ๋…ธํŠธ๋ถ ์™ธ๋ถ€๋กœ ์ „ํ˜€ ์œ ์ถœ๋˜์ง€ ์•Š์Œ

๐Ÿ’กTip: ์—ฐ๊ตฌ์ž / ML ์—”์ง€๋‹ˆ์–ด (Mac Studio M5 Max 128GB, $4,000) - ์ฃผ์š”: ํ’ˆ์งˆ ์ค‘์‹ฌ Llama 3.3 70B Q5 (49 GB) - ์ „๋ฌธ: ๋น„์˜์–ด๊ถŒ ์—ฐ๊ตฌ์šฉ Qwen3 72B Q4 - ์ฝ”๋”ฉ: DeepSeek Coder V2 16B - ๋น„์ „: ๋…ผ๋ฌธ ๊ทธ๋ฆผ ๋ถ„์„์šฉ Llama 3.2 Vision 11B - ๋„ค ๊ฐ€์ง€ ๋ชจ๋ธ ๋™์‹œ ๋กœ๋“œ

๐Ÿ’กTip: ๊ฐ€์ •์šฉ AI ์„œ๋ฒ„ (Mac Mini M5 Pro 64GB, ์ƒ์‹œ ๊ฐ€๋™) - ์Œ์„ฑ ์–ด์‹œ์Šคํ„ดํŠธ: Llama 3.3 8B + Whisper + Piper - RAG: ์ž„๋ฒ ๋”ฉ์„ ํ™œ์šฉํ•œ ๊ฐ€์กฑ ๋ฌธ์„œ Q&A - REST API๋ฅผ ํ†ตํ•œ ๊ฐ€์กฑ ๊ตฌ์„ฑ์› ์ฝ”๋”ฉ ์ง€์› - ์ „๋ ฅ ๋น„์šฉ: ์—ฐ๊ฐ„ ์•ฝ $35 - ๋Œ€์ฒด ํšจ๊ณผ: 4์ธ ChatGPT Plus = ์—ฐ๊ฐ„ $1,000

2026๋…„ ํ”ผํ•ด์•ผ ํ•  ๋ชจ๋ธ ๋ฐ ์ด์œ 

โš ๏ธWarning: Llama 3.3 (๋ชจ๋“  ํฌ๊ธฐ) ์‚ฌ์šฉ ๊ธˆ์ง€ โ€” 2023๋…„ ์ถœ์‹œ, Llama 3 ๋ฐ 3.1๋กœ ๋Œ€์ฒด๋จ. ๋™์ผ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜ ๋Œ€๋น„ ํ’ˆ์งˆ์ด 30~50% ๋‚ฎ์Œ. ๊ตฌํ˜• ํŠœํ† ๋ฆฌ์–ผ์— ์—ฌ์ „ํžˆ ๋“ฑ์žฅํ•˜๋ฏ€๋กœ ๋”ฐ๋ฅด์ง€ ๋งˆ์‹ญ์‹œ์˜ค. ๋Œ€์ฒด ๋ชจ๋ธ: Llama 3.3 8B.

โš ๏ธWarning: Vicuna, Alpaca, WizardLM ์‚ฌ์šฉ ๊ธˆ์ง€ โ€” 2023๋…„๋Œ€ ์ปค๋ฎค๋‹ˆํ‹ฐ ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ. ํ˜„์žฌ ๋ฒ ์ด์Šค ๋ชจ๋ธ(Llama 3.3, Qwen3)์ด ์ด๋ฏธ ๋™๋“ฑํ•˜๊ฑฐ๋‚˜ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•ฉ๋‹ˆ๋‹ค. ๋Œ€์ฒด ๋ชจ๋ธ: Qwen3 14B ๋˜๋Š” Llama 3.3 8B.

โš ๏ธWarning: Falcon 180B ์‚ฌ์šฉ ๊ธˆ์ง€ โ€” ์†Œ๋น„์ž์šฉ Apple Silicon์—์„œ ์‹คํ–‰ ๋ถˆ๊ฐ€. Llama 3.3 70B(๋” ์ž‘์Œ)๊ฐ€ ์„ฑ๋Šฅ์ด ๋” ๋›ฐ์–ด๋‚ฉ๋‹ˆ๋‹ค. ๋Œ€์ฒด ๋ชจ๋ธ: Llama 3.3 70B Q5.

โš ๏ธWarning: ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—์„œ FP16 ์–‘์žํ™” ์‚ฌ์šฉ ๊ธˆ์ง€ โ€” Llama 3.3 70B FP16 = 140 GB๋กœ ์–ด๋–ค Mac์—๋„ ํƒ‘์žฌ ๋ถˆ๊ฐ€. Q5 ๋Œ€๋น„ ํ’ˆ์งˆ ํ–ฅ์ƒ์€ 1% ๋ฏธ๋งŒ. ๋Œ€์ฒด: Q4_K_M ๋˜๋Š” Q5_K_M.

โš ๏ธWarning: ์ˆœ์ˆ˜ ๋ฒ ์ด์Šค ๋ชจ๋ธ (instruct ๋ณ€ํ˜• ์—†์Œ) ์‚ฌ์šฉ ๊ธˆ์ง€ โ€” ๋ฒ ์ด์Šค ๋ชจ๋ธ์€ ํ…์ŠคํŠธ๋ฅผ ์™„์„ฑํ•˜์ง€๋งŒ ์ง€์‹œ๋ฅผ ๋”ฐ๋ฅด์ง€ ์•Š์Šต๋‹ˆ๋‹ค. "-instruct" ๋˜๋Š” "-chat" ์ ‘๋ฏธ์‚ฌ๋ฅผ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ๋Œ€์ฒด: ๋™์ผ ๋ชจ๋ธ์˜ instruct ๋ณ€ํ˜•.

โš ๏ธWarning: ํ™œ๋ฐœํ•˜๊ฒŒ ๊ฐœ๋ฐœ๋˜์ง€ ์•Š๋Š” ๋ชจ๋ธ ์‚ฌ์šฉ ๊ธˆ์ง€ โ€” StableLM, RedPajama, MPT, Pythia: ๊ฐœ๋ฐœ ์ค‘๋‹จ ๋˜๋Š” ์ •์ฒด ์ƒํƒœ. ์ •๊ธฐ ์—…๋ฐ์ดํŠธ๋ฅผ ์ œ๊ณตํ•˜๋Š” Meta, Alibaba, Mistral, Microsoft์˜ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๋ชจ๋ธ ํ˜•์‹ ๋น ๋ฅธ ์ฐธ์กฐ

ํ˜•์‹์‚ฌ์šฉ ๋„๊ตฌ์›๋ณธ ๋Œ€๋น„ ํฌ๊ธฐ
GGUF Q4_K_MOllama, llama.cppFP16์˜ ์•ฝ 30%
GGUF Q5_K_MOllama, llama.cppFP16์˜ ์•ฝ 35%
GGUF Q8_0Ollama, llama.cppFP16์˜ ์•ฝ 50%
MLX 4๋น„ํŠธMLX ํ”„๋ ˆ์ž„์›ŒํฌFP16์˜ ์•ฝ 30%
MLX 8๋น„ํŠธMLX ํ”„๋ ˆ์ž„์›ŒํฌFP16์˜ ์•ฝ 50%
FP16 (์›๋ณธ)๋ชจ๋“  ํ”„๋ ˆ์ž„์›Œํฌ100%

์ด ๋ฌธ์„œ์˜ ํฌ๊ธฐ๋Š” ๋ณ„๋„ ๋ช…์‹œ๊ฐ€ ์—†๋Š” ํ•œ GGUF Q4_K_M ๊ธฐ์ค€์ž…๋‹ˆ๋‹ค. MLX 4๋น„ํŠธ ๋™๋“ฑ ๋ชจ๋ธ์€ ํฌ๊ธฐ๊ฐ€ ๋น„์Šทํ•ฉ๋‹ˆ๋‹ค. ์ •ํ™•ํ•œ ๋ฐ”์ดํŠธ ์ˆ˜๋Š” HuggingFace์˜ ๋ชจ๋ธ ์นด๋“œ๋ฅผ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

๋น ๋ฅธ ์ฐธ์กฐ: ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ ๋ฐฉ๋ฒ•

bash
# 16 GB Mac
ollama pull phi4

# 36 GB Mac (ํ•˜๋‚˜ ์„ ํƒ)
ollama pull llama3.1:8b
ollama pull qwen2.5:14b
ollama pull mistral:7b

# 64 GB Mac
ollama pull qwen2.5:34b
ollama pull mixtral:8x7b

# 128 GB Mac
ollama pull llama3.1:70b
ollama pull qwen2.5:72b

# ํŠนํ™” ๋ชจ๋ธ
ollama pull deepseek-coder-v2:16b   # ์ฝ”๋”ฉ
ollama pull llama3.2-vision:11b     # ๋น„์ „
ollama pull aya-expanse:32b         # ๋ฒˆ์—ญ

๋‘ ๊ฐ€์ง€ ๋ชจ๋ธ์„ ๋™์‹œ์— ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์˜ˆ, ํ™˜๊ฒฝ ๋ณ€์ˆ˜์— `OLLAMA_MAX_LOADED_MODELS=2`๋ฅผ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค. 64GB์—์„œ๋Š” 8B์™€ 34B ๋ชจ๋ธ์„ ๋™์‹œ์— ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ดˆ๋ณด์ž์—๊ฒŒ ๊ฐ€์žฅ ์ข‹์€ ๋ชจ๋ธ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Llama 3.3 8B์ž…๋‹ˆ๋‹ค. ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ์ œ๊ณต๋˜๋ฉฐ ์ถœ๋ ฅ ํ’ˆ์งˆ์ด ์šฐ์ˆ˜ํ•˜๊ณ  ๊ฒ€์ฆ๋œ ์‹ค์ ์„ ๋ณด์œ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. M1 ์ด์ƒ์˜ ๋ชจ๋“  Mac์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.

Mixtral 8x22B๋Š” Llama 8B๋ณด๋‹ค ๋น ๋ฆ…๋‹ˆ๊นŒ?

์•„๋‹™๋‹ˆ๋‹ค. M5 Pro ๊ธฐ์ค€ ์•ฝ๊ฐ„ ๋А๋ฆฝ๋‹ˆ๋‹ค(40~50 tok/s ๋Œ€ 50~60 tok/s). ๊ทธ๋Ÿฌ๋‚˜ ์ถ”๋ก  ์„ฑ๋Šฅ์€ ๋” ๋›ฐ์–ด๋‚ฉ๋‹ˆ๋‹ค.

2026๋…„ ์ตœ๊ณ ์˜ ๋กœ์ปฌ LLM์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Apple Silicon ๋Œ€๋ถ€๋ถ„์˜ ์‚ฌ์šฉ์ž์—๊ฒŒ๋Š” Qwen3(Mac์— ๋งž๋Š” ํฌ๊ธฐ)์ด ํ’ˆ์งˆ ๋ฒค์น˜๋งˆํฌ์—์„œ ํ˜„์žฌ ์„ ๋‘์ž…๋‹ˆ๋‹ค. 128GB Mac์—์„œ๋Š” Llama 3.3 70B๊ฐ€ ๋น„์Šทํ•œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•ฉ๋‹ˆ๋‹ค. 16GB ๋ฏธ๋งŒ์˜ ๊ฒฝ์šฐ Phi-4๊ฐ€ 3.8B ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ 2024๋…„ 8B ๋ชจ๋ธ์— ํ•„์ ํ•˜๋Š” ๋†€๋ผ์šด ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค.

Mac์—์„œ Llama 3.3 405B๋ฅผ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์•„๋‹™๋‹ˆ๋‹ค. Llama 3.3 405B๋Š” Q4 ์–‘์žํ™”์—์„œ๋„ 200GB ์ด์ƒ์ด ํ•„์š”ํ•˜๋ฏ€๋กœ ์–ด๋–ค ์†Œ๋น„์ž์šฉ Mac์—๋„ ์ถฉ๋ถ„ํ•œ ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค. M5 Ultra(2026๋…„ ์ค‘๋ฐ˜ ์˜ˆ์ƒ, 256 GB)๋ฅผ ๊ธฐ๋‹ค๋ฆฌ์‹ญ์‹œ์˜ค โ€” ์ด๊ฒƒ์ด Q3~Q4์—์„œ 405B๋ฅผ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ์ฒซ ๋ฒˆ์งธ ์†Œ๋น„์ž์šฉ ํ•˜๋“œ์›จ์–ด๊ฐ€ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

Qwen์ด ๋กœ์ปฌ ์‚ฌ์šฉ์—์„œ Llama๋ณด๋‹ค ๋‚ซ์Šต๋‹ˆ๊นŒ?

๋Œ€๋ถ€๋ถ„์˜ ์ž‘์—…์—์„œ Qwen3๋Š” ๋™์ผ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜ ๊ธฐ์ค€ ๋ฒค์น˜๋งˆํฌ์—์„œ Llama 3.3๋ณด๋‹ค ์•ฝ๊ฐ„ ์•ž์„œ ์žˆ์Šต๋‹ˆ๋‹ค(MMLU์—์„œ 1~3์  ์ฐจ์ด). Llama๋Š” ๋” ๋„“์€ ์ปค๋ฎค๋‹ˆํ‹ฐ ์ง€์›๊ณผ ๋” ๋งŽ์€ ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ์„ ๋ณด์œ ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ์‚ฌ์šฉ์ž๋Š” ์ฐจ์ด๋ฅผ ์ฒด๊ฐํ•˜๊ธฐ ์–ด๋ ค์šฐ๋ฏ€๋กœ ๊ฐ€์šฉ์„ฑ๊ณผ ํŒŒ์ธํŠœ๋‹ ์ƒํƒœ๊ณ„๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.

์‹ค์ œ๋กœ ์œ ์šฉํ•œ ์ตœ์†Œ ๋ชจ๋ธ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

ํŒŒ๋ผ๋ฏธํ„ฐ 3.8B์˜ Phi-4์ž…๋‹ˆ๋‹ค. MMLU ์ ์ˆ˜ 84.8๋กœ ์ผ๋ถ€ 2024๋…„ 8B ๋ชจ๋ธ์— ํ•„์ ํ•ฉ๋‹ˆ๋‹ค. ์ฑ„ํŒ…๊ณผ Q&A์—์„œ ๋†€๋ž๋„๋ก ์œ ๋Šฅํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋”ฉ์ด๋‚˜ ๋ณต์žกํ•œ ์ถ”๋ก ์—๋Š” Llama 3.3 8B ๋˜๋Š” Qwen3 14B๋กœ ์ด๋™ํ•˜์‹ญ์‹œ์˜ค.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Mac์— ๋งž๋Š” ๋ชจ๋ธ์„ ์„ ํƒํ•˜์…จ์Šต๋‹ˆ๊นŒ? PromptQuorum์œผ๋กœ ํ•ด๋‹น ๋ชจ๋ธ์˜ ์‘๋‹ต์„ GPT-4, Claude, Gemini ๋ฐ 22๊ฐœ ์ด์ƒ์˜ ๋ชจ๋ธ๊ณผ ๋‚˜๋ž€ํžˆ ๋น„๊ตํ•ด ๋ณด์‹ญ์‹œ์˜ค โ€” ๋กœ์ปฌ Llama, Qwen ๋˜๋Š” Phi ๋ชจ๋ธ์ด ํŠน์ • ์‚ฌ์šฉ ์‚ฌ๋ก€์—์„œ ํด๋ผ์šฐ๋“œ ํ’ˆ์งˆ์— ๋ถ€ํ•ฉํ•˜๋Š”์ง€ ๊ฒ€์ฆํ•˜์‹ญ์‹œ์˜ค.

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

Apple Silicon ์ตœ์  ๋ชจ๋ธ 2026: 16GB~128GB | PromptQuorum