Skip to main content
PromptQuorumPromptQuorum
ํ™ˆ/๊ณ ๊ธ‰ ๋กœ์ปฌ LLM/DeepSeek vs Qwen: ๋กœ์ปฌ LLM ๋น„๊ต 2026
Overview & Reference

DeepSeek vs Qwen: ๋กœ์ปฌ LLM ๋น„๊ต 2026

ยท11๋ถ„ ๋ถ„๋Ÿ‰ยทHans Kuepper ์ € ยท PromptQuorum ์ฐฝ๋ฆฝ์ž, ๋ฉ€ํ‹ฐ ๋ชจ๋ธ AI ๋””์ŠคํŒจ์น˜ ๋„๊ตฌ ยท PromptQuorum

์ˆ˜ํ•™ ๋ฐ ๋‹จ๊ณ„๋ณ„ ์ถ”๋ก ์—์„œ DeepSeek-R1-Distill-Qwen-32B๋Š” MATH-500 ๊ธฐ์ค€ 94%๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉฐ Qwen3 32B(90.3%)๋ฅผ ์•ž์„ญ๋‹ˆ๋‹ค. ์ฝ”๋”ฉ๊ณผ ์ค‘๊ตญ์–ด ํ…์ŠคํŠธ์—์„œ๋Š” Qwen3 32B๊ฐ€ HumanEval ๊ธฐ์ค€ 91.5%๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉฐ DeepSeek ์ฆ๋ฅ˜(83%)๋ฅผ ์•ž์„ญ๋‹ˆ๋‹ค. ๋‘ ๋ชจ๋ธ ๋ชจ๋‘ ๋™์ผํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜์—์„œ ๋™์ผํ•œ VRAM์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

DeepSeek-R1 ์ฆ๋ฅ˜ ๋ชจ๋ธ๊ณผ Qwen3๋Š” 2026๋…„ ๋กœ์ปฌ ๋ฐฐํฌ์—์„œ ๊ฐ€์žฅ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ๋‘ ๊ฐ€์ง€ ๋ชจ๋ธ ๊ณ„์—ด์ž…๋‹ˆ๋‹ค. ๋™์ผํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜์—์„œ ๋™์ผํ•œ VRAM์ด ํ•„์š”ํ•˜๋ฉฐ โ€” Q4_K_M ๊ธฐ์ค€ 7B ๋ชจ๋ธ์€ 5.5 GB โ€” ๊ฐ๊ฐ ์„œ๋กœ ๋‹ค๋ฅธ ๊ฐ•์ ์— ์ตœ์ ํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. DeepSeek-R1 ์ฆ๋ฅ˜ ๋ชจ๋ธ์€ ์ˆ˜ํ•™ ๋ฐ ๋‹จ๊ณ„๋ณ„ ์ถ”๋ก ์—์„œ ์šฐ์ˆ˜ํ•˜๊ณ , Qwen3๋Š” ์ฝ”๋”ฉ ๋ฐ ์ค‘๊ตญ์–ด ํ…์ŠคํŠธ ์ž‘์—…์—์„œ ์šฐ์ˆ˜ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ฐ€์ด๋“œ๋Š” ์ง์ ‘์ ์ธ ๋ฒค์น˜๋งˆํฌ ๋น„๊ต ํ‘œ, ํ•˜๋“œ์›จ์–ด ๋“ฑ๊ธ‰๋ณ„ ์„ธ๋ถ€ ๋ถ„์„, ๊ทธ๋ฆฌ๊ณ  ์ผ๋ฐ˜์ ์ธ ์‚ฌ์šฉ ์‚ฌ๋ก€๋ณ„ ํ•œ ๋ฌธ์žฅ ํŒ์ •์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ์š”์ 

  • ๋™์ผ VRAM: 7B ๋ชจ๋ธ ๋ชจ๋‘ Q4_K_M ๊ธฐ์ค€ 5.5 GB; 32B ๋ชจ๋ธ ๋ชจ๋‘ 20.5 GB ํ•„์š”
  • ์ˆ˜ํ•™: DeepSeek-R1-Distill-Qwen-32B ์šฐ์„ธ (MATH-500 94% vs 90.3%)
  • ์ฝ”๋”ฉ: Qwen3-Coder 32B ์šฐ์„ธ (HumanEval 91.5% vs 83%)
  • ์ค‘๊ตญ์–ด ํ…์ŠคํŠธ: Qwen3 ์šฐ์„ธ โ€” ๋„ค์ดํ‹ฐ๋ธŒ ํ† ํฌ๋‚˜์ด์ €๋กœ CJK ํ…์ŠคํŠธ 30โ€“40% ๋” ํšจ์œจ์ 
  • ์ถ”๋ก  ์ฒด์ธ: DeepSeek-R1 ์ฆ๋ฅ˜ ๋ชจ๋ธ์€ ๊ธฐ๋ณธ์ ์œผ๋กœ ๊ธด ์‚ฌ๊ณ  ์ฒด์ธ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค
  • ๋ฒ”์šฉ ์–ด์‹œ์Šคํ„ดํŠธ: Qwen3 14B๊ฐ€ ๋‹ค์†Œ ๋” ์œ ์ฐฝํ•˜๋ฉฐ, DeepSeek ์ฆ๋ฅ˜ 14B๋Š” ๋‹จ์ˆœ ์ž‘์—…์—์„œ ๊ณผ๋„ํ•œ ์ถ”๋ก  ๊ฒฝํ–ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค

๋ฒค์น˜๋งˆํฌ ์ง์ ‘ ๋น„๊ตํ‘œ

๋ชจ๋“  ๊ฒฐ๊ณผ๋Š” Q4_K_M ์–‘์žํ™” ๊ธฐ์ค€์ž…๋‹ˆ๋‹ค. GPU ํ–‰์˜ ์†๋„๋Š” NVIDIA RTX 4090 (24 GB VRAM), Mac ํ–‰์€ Apple M3 Max 48 GB์—์„œ ์ธก์ •ํ–ˆ์Šต๋‹ˆ๋‹ค.

๋ชจ๋ธVRAMMMLU (%)MATH-500 (%)HumanEval (%)์†๋„ (ํ† ํฐ/์ดˆ)
Qwen3 7B5.5 GB72.562.574.650โ€“80
DS-R1-Distill-Qwen 7B5.5 GB70.188.068.450โ€“80
Qwen3 14B9.5 GB79.276.182.130โ€“50
DS-R1-Distill-Qwen 14B9.5 GB75.890.075.530โ€“50
Qwen3 32B20.5 GB83.490.391.515โ€“30
DS-R1-Distill-Qwen 32B20.5 GB80.694.083.215โ€“30

ํ•˜๋“œ์›จ์–ด ๋“ฑ๊ธ‰๋ณ„ ๊ถŒ์žฅ ๋ชจ๋ธ

VRAM ์š”๊ตฌ์‚ฌํ•ญ์€ ๋™์ผํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ํฌ๊ธฐ์—์„œ ๋‘ ๊ณ„์—ด ๋ชจ๋‘ ๋™์ผํ•ฉ๋‹ˆ๋‹ค. DeepSeek์™€ Qwen ์ค‘ ์„ ํƒ์€ ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ์ด ์•„๋‹Œ ์ž‘์—… ์„ ํ˜ธ๋„์— ๋”ฐ๋ฆ…๋‹ˆ๋‹ค.

  • 8 GB VRAM (RTX 3060 / M2 16 GB): ์ฝ”๋”ฉ/์ฑ„ํŒ…์—๋Š” Qwen3 7B; ์ˆ˜ํ•™ ํŠœํ„ฐ๋ง์—๋Š” DS-R1-Distill-Qwen-7B
  • 12 GB VRAM (RTX 3080 / M2 Pro 24 GB): ๋ฒ”์šฉ ์‚ฌ์šฉ์—๋Š” Qwen3 14B; ์ถ”๋ก  ์ฒด์ธ์—๋Š” DS-R1-Distill-Qwen-14B
  • 24 GB VRAM (RTX 4090 / M3 Max 48 GB): Qwen3-Coder 32B ๋˜๋Š” Qwen3 32B โ€” ์ด ๋“ฑ๊ธ‰์—์„œ ์ตœ๊ณ ์˜ ๋ฒ”์šฉ ๋กœ์ปฌ ๋ชจ๋ธ
  • 48 GB+ (M2/M3 Ultra / RTX 4090 ๋“€์–ผ): Qwen3 72B (MMLU 86.1%, HumanEval 97%) โ€” GPT-4์— ๊ทผ์ ‘ํ•œ ์„ฑ๋Šฅ
  • CPU ์ „์šฉ (32+ GB RAM): Qwen3 7B ๋˜๋Š” DS-R1-Distill 7B โ€” ์ตœ์‹  ๋…ธํŠธ๋ถ CPU์—์„œ ๋ถ„๋‹น 3โ€“8 ํ† ํฐ์œผ๋กœ ๋™์ž‘

DeepSeek ๋กœ์ปฌ ๋ชจ๋ธ ์„ค๋ช…

DeepSeek๋Š” ์ถ”๋ก  ๋ชจ๋ธ R1์„ ์„œ๋ฒ„ ์ˆ˜์ค€ ํ•˜๋“œ์›จ์–ด๊ฐ€ ํ•„์š”ํ•œ 671B MoE(์ „๋ฌธ๊ฐ€ ํ˜ผํ•ฉ) ์•„ํ‚คํ…์ฒ˜๋กœ ์ถœ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค. ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—์„œ ๋กœ์ปฌ๋กœ ์‚ฌ์šฉํ•˜๊ธฐ ์œ„ํ•œ ์‹ค์šฉ์ ์ธ ์„ ํƒ์€ ์ฆ๋ฅ˜ ๋ฒ„์ „์ž…๋‹ˆ๋‹ค โ€” R1์˜ ์ฒด์ธ ์ถ”๋ก  ๋ฐฉ์‹์„ ๋ณต์ œํ•˜๋„๋ก ํ›ˆ๋ จ๋œ ์†Œํ˜• ๋ฐ€์ง‘ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.

  • DeepSeek-R1-Distill-Qwen-7B: Q4_K_M ๊ธฐ์ค€ 5.5 GB VRAM. 7B ๋“ฑ๊ธ‰์—์„œ ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ์ˆ˜ํ•™ ๋ชจ๋ธ (MATH-500 88%). ๊ธด ์ถ”๋ก  ์ฒด์ธ์„ ์ƒ์„ฑํ•˜๋ฉฐ, ๋น ๋ฅธ ์ฑ„ํŒ…์„ ์œ„ํ•ด์„œ๋Š” ์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ๋กœ ์‚ฌ๊ณ  ์ฒด์ธ์„ ๋น„ํ™œ์„ฑํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • DeepSeek-R1-Distill-Qwen-14B: 9.5 GB VRAM. 14B ๋“ฑ๊ธ‰์—์„œ VRAM๋‹น ์ตœ๊ณ ์˜ ์ถ”๋ก  ์„ฑ๋Šฅ. ์ˆ˜ํ•™ ํŠœํ„ฐ๋ง, ๋…ผ๋ฆฌ ํผ์ฆ, ๊ตฌ์กฐํ™”๋œ ๋ถ„์„ ์ž‘์—…์— ์ด์ƒ์ ์ž…๋‹ˆ๋‹ค.
  • DeepSeek-R1-Distill-Qwen-32B: 20.5 GB VRAM. ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ๋ชจ๋ธ ์ค‘ ๊ฐ€์žฅ ๋†’์€ MATH-500 ์ ์ˆ˜: 94%. ์ฝ”๋”ฉ๋ณด๋‹ค ์ˆ˜ํ•™์  ์ •ํ™•๋„๊ฐ€ ์šฐ์„ ์ผ ๋•Œ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • DeepSeek-V3 (์ „์ฒด): 671B MoE โ€” Q4 ํ˜•์‹์œผ๋กœ 400 GB+ RAM ํ•„์š” โ€” ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—์„œ๋Š” ์‹ค์šฉ์ ์ด์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋Œ€์‹  ์ฆ๋ฅ˜ ๋ฒ„์ „์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • Ollama ๋ช…๋ น์–ด: ollama run deepseek-r1:7b (๊ธฐ๋ณธ์ ์œผ๋กœ Q4_K_M ์ฆ๋ฅ˜ ๋ฒ„์ „์„ ๋‹ค์šด๋กœ๋“œ)

Qwen3 ๋กœ์ปฌ ๋ชจ๋ธ ์„ค๋ช…

Qwen3๋Š” ์•Œ๋ฆฌ๋ฐ”๋ฐ”์˜ 2025๋…„ 10์›” ์ถœ์‹œ ์ œํ’ˆ์œผ๋กœ ๋ฒ ์ด์Šค, Coder, Vision-Language ๋ณ€ํ˜•์„ ํฌํ•จํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋“  ๋ฒ ์ด์Šค ๋ชจ๋ธ์€ 128K ์ปจํ…์ŠคํŠธ ์ฐฝ๊ณผ Apache 2.0 ๋ผ์ด์„ ์Šค๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

  • Qwen3 7B: 5.5 GB VRAM. ์ฝ”๋”ฉ ๋ฐ ์ค‘๊ตญ์–ด ํ…์ŠคํŠธ์— ๊ฐ€์žฅ ์ ํ•ฉํ•œ 7B ๋ฒ”์šฉ ๋ชจ๋ธ. HumanEval 74.6%๋Š” ์ฝ”๋“œ ๋ถ„์•ผ์—์„œ ๋ชจ๋“  7B ๊ฒฝ์Ÿ ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.
  • Qwen3 14B: 9.5 GB VRAM. ํ’ˆ์งˆ๊ณผ ์†๋„์˜ ์ตœ์  ๊ท ํ˜•์ . HumanEval 82.1%, MMLU 79.2%. 12 GB VRAM ์„ค์ • ๋Œ€๋ถ€๋ถ„์—์„œ ์ตœ์„ ์˜ ์„ ํƒ์ž…๋‹ˆ๋‹ค.
  • Qwen3 32B: 20.5 GB VRAM. HumanEval 91.5% โ€” 48 GB VRAM ๋ฏธ๋งŒ์—์„œ ์ตœ๊ณ ์˜ ์ฝ”๋”ฉ ๋ฒค์น˜๋งˆํฌ ์ ์ˆ˜.
  • Qwen3-Coder 32B: ๋ฒ ์ด์Šค 32B์™€ ๋™์ผํ•œ VRAM์œผ๋กœ ์ฝ”๋“œ ์ƒ์„ฑ ๋ฐ ๋ฆฌ๋ทฐ์— ํŠนํ™” ๋ฏธ์„ธ ์กฐ์ •๋จ. ์ฝ”๋”ฉ์ด ์ฃผ์š” ์ž‘์—…์ผ ๋•Œ ๋ฒ ์ด์Šค ๋Œ€์‹  ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • Qwen3 72B: 46 GB VRAM. MMLU 86.1%, HumanEval 97%. 48 GB+ ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ(M2/M3 Ultra) ๋˜๋Š” ๋ฉ€ํ‹ฐ GPU ์„ค์ •์—์„œ๋งŒ ์‹คํ–‰ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
  • Ollama ๋ช…๋ น์–ด: ollama run qwen2.5:14b-instruct-q4_K_M

Apple Silicon vs NVIDIA: ๋‘ ๊ณ„์—ด ์‹คํ–‰

DeepSeek ์ฆ๋ฅ˜ ๋ชจ๋ธ๊ณผ Qwen3 ๋ชจ๋‘ Ollama ๋˜๋Š” llama.cpp๋ฅผ ํ†ตํ•ด Metal ๊ฐ€์†์œผ๋กœ Apple Silicon์—์„œ ์ž˜ ๋™์ž‘ํ•ฉ๋‹ˆ๋‹ค. ํ•ต์‹ฌ ์ฐจ์ด๋Š” ๋ฉ”๋ชจ๋ฆฌ ๋Œ€์—ญํญ์ž…๋‹ˆ๋‹ค.

ํ•˜๋“œ์›จ์–ด์ตœ์  ๋ชจ๋ธ ๋“ฑ๊ธ‰์†๋„ (7B)์†๋„ (32B)๋น„๊ณ 
M2/M3 16 GB7B ์ „์šฉ30โ€“50 ํ† ํฐ/์ดˆN/A๋‘ 7B ๋ชจ๋ธ ๋ชจ๋‘ ์ ํ•ฉ; 14B๋Š” ์Šค์™‘ ์‚ฌ์šฉ
M3 Pro 36 GB14B ์ตœ์ 60โ€“90 ํ† ํฐ/์ดˆN/A14B ์ „์†๋ ฅ; 32B๋Š” ์Šค์™‘ ์‚ฌ์šฉ
M3 Max 48 GB32B ์พŒ์ 80โ€“120 ํ† ํฐ/์ดˆ15โ€“25 ํ† ํฐ/์ดˆ32B ์‹คํ–‰ ์ตœ๊ณ ์˜ ์†Œ๋น„์ž๊ธ‰ Apple Silicon
RTX 4060 8 GB7B ์ „์šฉ50โ€“80 ํ† ํฐ/์ดˆN/A (๋ถ€๋ถ„ ์˜คํ”„๋กœ๋“œ)7B ์™„์ „ ์ ํ•ฉ; 14B๋Š” CPU ์˜คํ”„๋กœ๋“œ ํ•„์š”
RTX 4090 24 GB32B100โ€“150 ํ† ํฐ/์ดˆ18โ€“28 ํ† ํฐ/์ดˆ32B ์‹คํ–‰ ์ตœ๊ณ ์˜ ๋‹จ์ผ GPU

์‚ฌ์šฉ ์‚ฌ๋ก€๋ณ„ ํŒ์ •

์ผ๋ฐ˜์ ์ธ ๋กœ์ปฌ LLM ์‚ฌ์šฉ ์‚ฌ๋ก€๋ณ„ ํ•œ ๋ฌธ์žฅ ๋‹ต๋ณ€:

  • ์ˆ˜ํ•™ ๊ณผ์™ธ/ํŠœํ„ฐ๋ง: DS-R1-Distill-Qwen-7B โ€” MATH-500 88%๋กœ ๋™์ผ VRAM์˜ Qwen3 7B(62.5%)๋ฅผ ์••๋„
  • ์ฝ”๋“œ ์ƒ์„ฑ/๊ฒ€ํ† : Qwen3-Coder 32B โ€” HumanEval 91.5%, ์†Œ๋น„์ž ํ•˜๋“œ์›จ์–ด์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ๋ชจ๋ธ ์ค‘ ์ตœ๊ณ 
  • ์ค‘๊ตญ์–ด ์ฑ„ํŒ…: Qwen3 7B โ€” ๋„ค์ดํ‹ฐ๋ธŒ CJK ํ† ํฌ๋‚˜์ด์ €๋กœ ์ค‘๊ตญ์–ด ํ…์ŠคํŠธ๋ฅผ 30โ€“40% ๋” ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌ
  • ๋‹จ๊ณ„๋ณ„ ๋ถ„์„/์ถ”๋ก  ์ฒด์ธ: DS-R1-Distill-Qwen-14B โ€” ๊ธฐ๋ณธ์ ์œผ๋กœ ๋ช…์‹œ์ ์ธ ์‚ฌ๊ณ  ์ฒด์ธ์„ ์ƒ์„ฑ
  • ์ผ์ƒ ๋ฒ”์šฉ ์–ด์‹œ์Šคํ„ดํŠธ (8 GB VRAM): Qwen3 7B โ€” ๋” ์œ ์ฐฝํ•œ ๋Œ€ํ™”, ๋‹จ์ˆœ ์ž‘์—…์—์„œ DeepSeek์˜ ๊ณผ๋„ํ•œ ์ถ”๋ก  ๋ฐฉ์ง€
  • ๊ธฐ์—… ํ”„๋ผ์ด๋น— ๋ฐฐํฌ (ํ•œ๊ตญ): ๋‘ ๋ชจ๋ธ ๋ชจ๋‘ ๋กœ์ปฌ ์‹คํ–‰ ์‹œ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ธฐ๊ธฐ๋ฅผ ๋ฒ—์–ด๋‚˜์ง€ ์•Š์•„ PIPA(๊ฐœ์ธ์ •๋ณด๋ณดํ˜ธ๋ฒ•) ๋ฐ์ดํ„ฐ ๊ฑฐ์ฃผ ์š”๊ฑด์„ ์ถฉ์กฑ

์ž์ฃผ ๋ฌป๋Š” ์งˆ๋ฌธ

DeepSeek-R1๊ณผ ์ฆ๋ฅ˜ ๋ชจ๋ธ์€ ๊ฐ™์€ ๊ฒƒ์ธ๊ฐ€์š”?

์•„๋‹™๋‹ˆ๋‹ค. DeepSeek-R1์€ ์„œ๋ฒ„ ์ˆ˜์ค€ ํ•˜๋“œ์›จ์–ด๊ฐ€ ํ•„์š”ํ•œ 671B MoE ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ฆ๋ฅ˜ ๋ฒ„์ „(7B, 14B, 32B)์€ R1์˜ ์ถ”๋ก  ์Šคํƒ€์ผ์„ ๋ณต์ œํ•˜๋„๋ก ํ›ˆ๋ จ๋œ ๋…๋ฆฝ์ ์ธ ๋ฐ€์ง‘ ๋ชจ๋ธ๋กœ, ๋กœ์ปฌ ์‚ฌ์šฉ์— ์‹ค์šฉ์ ์ธ ์„ ํƒ์ž…๋‹ˆ๋‹ค.

DeepSeek์™€ Qwen์€ ๊ฐ ํŒŒ๋ผ๋ฏธํ„ฐ ํฌ๊ธฐ์—์„œ ๋™์ผํ•œ VRAM์„ ์‚ฌ์šฉํ•˜๋‚˜์š”?

์˜ˆ, ๋™์ผํ•œ ์–‘์žํ™” ์ˆ˜์ค€์—์„œ ๊ทธ๋ ‡์Šต๋‹ˆ๋‹ค. ๋‘ 7B ๋ชจ๋ธ ๋ชจ๋‘ Q4_K_M ๊ธฐ์ค€ ์•ฝ 5.5 GB๊ฐ€ ํ•„์š”ํ•˜๊ณ , ๋‘ 32B ๋ชจ๋ธ ๋ชจ๋‘ 20.5 GB๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ํ•˜๋“œ์›จ์–ด ์„ ํƒ์€ VRAM ์ฐจ์ด๊ฐ€ ์•„๋‹Œ ์ž‘์—… ์„ ํ˜ธ๋„์— ๋”ฐ๋ฆ…๋‹ˆ๋‹ค.

Ollama๋กœ DeepSeek-R1 ์ฆ๋ฅ˜ ๋ชจ๋ธ์„ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

์˜ˆ. 7B ์ฆ๋ฅ˜ ๋ฒ„์ „์€ ollama run deepseek-r1:7b, 32B๋Š” ollama run deepseek-r1:32b๋ฅผ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. Ollama๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ Q4_K_M์„ ๋‹ค์šด๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค.

์ค‘๊ตญ์–ด ํ…์ŠคํŠธ์—๋Š” DeepSeek์™€ Qwen ์ค‘ ์–ด๋А ๊ฒƒ์ด ๋” ๋‚˜์€๊ฐ€์š”?

Qwen3๊ฐ€ ์ค‘๊ตญ์–ด ํ…์ŠคํŠธ์—์„œ ํ›จ์”ฌ ๋” ์šฐ์ˆ˜ํ•ฉ๋‹ˆ๋‹ค. CJK ํ…์ŠคํŠธ์—์„œ 30โ€“40% ๋” ํšจ์œจ์ ์ธ ์ „์šฉ ์ค‘๊ตญ์–ด ํ† ํฌ๋‚˜์ด์ €๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. DeepSeek-R1 ์ฆ๋ฅ˜ ๋ชจ๋ธ์€ Qwen3 ๊ฐ€์ค‘์น˜๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋˜์–ด ์ค‘๊ตญ์–ด ์ง€์›์„ ์–ด๋А ์ •๋„ ์ƒ์†ํ•˜์ง€๋งŒ, Qwen3 ๋ฒ ์ด์Šค ๋ชจ๋ธ์ด ์ฒซ ๋ฒˆ์งธ ์„ ํƒ์ž…๋‹ˆ๋‹ค.

8 GB VRAM์—์„œ ์ˆ˜ํ•™์— ์–ด๋–ค ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋‚˜์š”?

DeepSeek-R1-Distill-Qwen-7B๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. ๋™์ผํ•œ VRAM์œผ๋กœ MATH-500 88%๋ฅผ ๋‹ฌ์„ฑํ•˜๋ฉฐ Qwen3 7B(62.5%)๋ณด๋‹ค 25ํฌ์ธํŠธ ๋†’์Šต๋‹ˆ๋‹ค.

DeepSeek-R1์„ ๋กœ์ปฌ๋กœ ์‹คํ–‰ํ•˜๋ฉด ๊ฐœ์ธ์ •๋ณด๋ณดํ˜ธ๋ฒ•์„ ์ค€์ˆ˜ํ•˜๋‚˜์š”?

๋ชจ๋ธ์„ ๋กœ์ปฌ๋กœ ์‹คํ–‰ํ•˜๋ฉด ๋ฐ์ดํ„ฐ๊ฐ€ ๊ท€ํ•˜์˜ ํ•˜๋“œ์›จ์–ด๋ฅผ ๋ฒ—์–ด๋‚˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ ์ถœ์ฒ˜์— ๊ด€๊ณ„์—†์ด PIPA(๊ฐœ์ธ์ •๋ณด๋ณดํ˜ธ๋ฒ•) ๋ฐ ๋ฐ์ดํ„ฐ ๊ฑฐ์ฃผ ์š”๊ฑด์„ ์ถฉ์กฑํ•ฉ๋‹ˆ๋‹ค. ์ค€์ˆ˜ ์—ฌ๋ถ€๋Š” ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ ๋ฐฉ์‹์— ๊ด€ํ•œ ๊ฒƒ์ด์ง€ ๋ชจ๋ธ ์ถœ์ฒ˜์— ๊ด€ํ•œ ๊ฒƒ์ด ์•„๋‹™๋‹ˆ๋‹ค.

โ† ๊ณ ๊ธ‰ ๋กœ์ปฌ LLM์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DeepSeek vs Qwen ๋กœ์ปฌ LLM 2026: ๋ฒค์น˜๋งˆํฌ ๋ฐ VRAM ๋น„๊ต | PromptQuorum