Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/์†Œํ˜• ๋กœ์ปฌ LLM ๋ชจ๋ธ: 2026๋…„ ์ €์šฉ๋Ÿ‰ RAM ๊ธฐ๊ธฐ๋ฅผ ์œ„ํ•œ ์ตœ๊ณ ์˜ 4B ๋ฏธ๋งŒ ๋ชจ๋ธ
Best Models

์†Œํ˜• ๋กœ์ปฌ LLM ๋ชจ๋ธ: 2026๋…„ ์ €์šฉ๋Ÿ‰ RAM ๊ธฐ๊ธฐ๋ฅผ ์œ„ํ•œ ์ตœ๊ณ ์˜ 4B ๋ฏธ๋งŒ ๋ชจ๋ธ

ยท8๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

์†Œํ˜• ๋กœ์ปฌ LLM(1B~4B ํŒŒ๋ผ๋ฏธํ„ฐ)์€ RAM 4~8GB ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰๋˜๋ฉฐ CPU์—์„œ ์ดˆ๋‹น 30~70 ํ† ํฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค -- ์‹ค์‹œ๊ฐ„ ์ฑ„ํŒ…์— ์ถฉ๋ถ„ํ•œ ์†๋„์ž…๋‹ˆ๋‹ค.

์†Œํ˜• ๋กœ์ปฌ LLM(1B~4B ํŒŒ๋ผ๋ฏธํ„ฐ)์€ RAM 4~8GB ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰๋˜๋ฉฐ CPU์—์„œ ์ดˆ๋‹น 30~70 ํ† ํฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค -- ์‹ค์‹œ๊ฐ„ ์ฑ„ํŒ…์— ์ถฉ๋ถ„ํ•œ ์†๋„์ž…๋‹ˆ๋‹ค. 2026๋…„ ์ตœ๊ณ ์˜ ์†Œํ˜• ๋ชจ๋ธ์€ Microsoft Phi-4 Mini 3.8B(์ตœ๊ณ  ์ถ”๋ก  ์„ฑ๋Šฅ), Google Gemma 2 2B(๊ฐ€์žฅ ๋น ๋ฆ„), Qwen3 3B(์ตœ๊ณ  ์ฝ”๋”ฉ ์„ฑ๋Šฅ), Meta Llama 3.2 3B(์ตœ๊ณ  ๋ฒ”์šฉ ์„ฑ๋Šฅ)์ž…๋‹ˆ๋‹ค.

Key Takeaways

  • ์†Œํ˜• ๊ทœ๋ชจ์—์„œ ์ตœ๊ณ  ์ถ”๋ก  ์„ฑ๋Šฅ: Phi-4 Mini 3.8B -- MMLU 68%, HumanEval 70%, RAM 4 GB์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅ.
  • CPU์—์„œ ๊ฐ€์žฅ ๋น ๋ฆ„: Gemma 2 2B -- ์ตœ์‹  ๋…ธํŠธ๋ถ์—์„œ ์ดˆ๋‹น 40~60 ํ† ํฐ, RAM 1.7 GB.
  • ์ตœ๊ณ  ์†Œํ˜• ์ฝ”๋”ฉ ๋ชจ๋ธ: Qwen3 3B -- RAM ~2 GB์—์„œ HumanEval 65%.
  • ์ตœ๊ณ  ๋ฒ”์šฉ 3B ๋ชจ๋ธ: Llama 3.2 3B -- ๊ฐ€์žฅ ๊ด‘๋ฒ”์œ„ํ•œ ์ปค๋ฎค๋‹ˆํ‹ฐ ์ง€์›, ์ปจํ…์ŠคํŠธ 128K, RAM 2.5 GB.
  • 2026๋…„ 4์›” ๊ธฐ์ค€, 2B ๋ฏธ๋งŒ ๋ชจ๋ธ ์ค‘ ์ „๋ฌธ์  ์ž‘์—…์— ์ ํ•ฉํ•œ ์ถœ๋ ฅ ํ’ˆ์งˆ์„ ์ƒ์„ฑํ•˜๋Š” ๋ชจ๋ธ์€ ์—†์Šต๋‹ˆ๋‹ค. ์‹ค์ œ ์—…๋ฌด์—๋Š” 3B ์ด์ƒ์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

"์†Œํ˜•" ๋กœ์ปฌ LLM์ด๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์–ธ์ œ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๊นŒ?

์†Œํ˜• ๋กœ์ปฌ LLM์€ ์ผ๋ฐ˜์ ์œผ๋กœ 40์–ต ๊ฐœ ๋ฏธ๋งŒ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๋ชจ๋ธ๋กœ ์ •์˜๋ฉ๋‹ˆ๋‹ค. Q4_K_M ์–‘์žํ™”์—์„œ ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์€ 1.5~3 GB์˜ RAM์„ ํ•„์š”๋กœ ํ•ฉ๋‹ˆ๋‹ค -- RAM 4~8 GB์˜ ๋ณด๊ธ‰ํ˜• ๋…ธํŠธ๋ถ ์ œ์•ฝ ์กฐ๊ฑด ๋‚ด์—์„œ ์ถฉ๋ถ„ํžˆ ์‹คํ–‰ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

2026๋…„ 4์›” ๊ธฐ์ค€, ์†Œํ˜• ๋ชจ๋ธ์€ ๋น ๋ฅธ ์š”์•ฝ, ๊ฐ„๋‹จํ•œ Q&A, ์ฝ”๋“œ ์Šค๋‹ˆํŽซ ์„ค๋ช…, ์งง์€ ํ…์ŠคํŠธ ๋ฒˆ์—ญ, ๋ถ„๋ฅ˜ ์ž‘์—…์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก , ๋ณต์žกํ•œ ์ฝ”๋“œ ์ƒ์„ฑ, ์žฅ๋ฌธ์˜ ์ผ๊ด€๋œ ๋ฌธ์„œ ์ž‘์„ฑ์—๋Š” ์ ํ•ฉํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

3B ๋ชจ๋ธ๊ณผ 7B ๋ชจ๋ธ ๊ฐ„์˜ ํ’ˆ์งˆ ์ฐจ์ด๋Š” ์ƒ๋‹นํ•ฉ๋‹ˆ๋‹ค -- GPT-4o mini์™€ GPT-5.5 ๊ฐ„์˜ ์ฐจ์ด์— ๊ฑฐ์˜ ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. RAM 8 GB ์‚ฌ์šฉ์ž์˜ ๊ฒฝ์šฐ, ๊ธฐ๊ธฐ์— ์—ฌ์œ ๊ฐ€ ์žˆ๋‹ค๋ฉด Q4_K_M์˜ 7B ๋ชจ๋ธ์ด ๊ฑฐ์˜ ํ•ญ์ƒ ๋” ๋‚˜์€ ์„ ํƒ์ž…๋‹ˆ๋‹ค. 7B ๋ชจ๋ธ ์ถ”์ฒœ์€ ์ดˆ๋ณด์ž๋ฅผ ์œ„ํ•œ ์ตœ๊ณ  ๋กœ์ปฌ LLM ๋ชจ๋ธ์„ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

์–ด๋–ค ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๊นŒ? ๋น ๋ฅธ ์„ ํƒ ๊ฐ€์ด๋“œ

๊ฒฐ์ • ํŠธ๋ฆฌ: ์šฐ์„ ์ˆœ์œ„(์ถ”๋ก , ์†๋„, ์ฝ”๋”ฉ)์— ๋”ฐ๋ผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. ํ™•์‹คํ•˜์ง€ ์•Š๋‹ค๋ฉด Llama 3.2 3B๋ฅผ ๊ธฐ๋ณธ์œผ๋กœ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
๊ฒฐ์ • ํŠธ๋ฆฌ: ์šฐ์„ ์ˆœ์œ„(์ถ”๋ก , ์†๋„, ์ฝ”๋”ฉ)์— ๋”ฐ๋ผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. ํ™•์‹คํ•˜์ง€ ์•Š๋‹ค๋ฉด Llama 3.2 3B๋ฅผ ๊ธฐ๋ณธ์œผ๋กœ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

Phi-4 Mini 3.8B -- 4B ๋ฏธ๋งŒ ํด๋ž˜์Šค์—์„œ ์ตœ๊ณ  ์ถ”๋ก  ์„ฑ๋Šฅ

Microsoft Phi-4 Mini๋Š” MMLU 68%์™€ HumanEval 70%๋ฅผ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค -- 2025๋…„ ์ด์ „์— ์ถœ์‹œ๋œ ๋งŽ์€ 7B ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•˜๋Š” ์ ์ˆ˜์ž…๋‹ˆ๋‹ค. ์ด๋Š” Phi-4 Mini๊ฐ€ ๊ด‘๋ฒ”์œ„ํ•œ ์›น ํ…์ŠคํŠธ๊ฐ€ ์•„๋‹Œ ์ถ”๋ก ๊ณผ ๋ฌธ์ œ ํ•ด๊ฒฐ์— ์ดˆ์ ์„ ๋งž์ถ˜ ์ •์ œ๋œ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ•™์Šต๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

2026๋…„ 4์›” ๊ธฐ์ค€, Phi-4 Mini๋Š” RAM 4~6 GB ํ•˜๋“œ์›จ์–ด์—์„œ ์ฃผ๋กœ ์ถ”๋ก (์ˆ˜ํ•™, ๋…ผ๋ฆฌ, ๋‹จ๊ณ„๋ณ„ ์„ค๋ช…)์ด๋‚˜ ์ฝ”๋”ฉ ์ง€์›์ด ํ•„์š”ํ•œ ์‚ฌ์šฉ์ž์—๊ฒŒ ๊ถŒ์žฅ๋˜๋Š” ์„ ํƒ์ž…๋‹ˆ๋‹ค.

SpecValue
MMLU68%
HumanEval70%
RAM (Q4_K_M)~2.5 GB
์ปจํ…์ŠคํŠธ128K ํ† ํฐ
CPU ์†๋„์ดˆ๋‹น 30~50 ํ† ํฐ
Ollama ๋ช…๋ น์–ดollama run phi4-mini

Gemma 2 2B -- CPU์—์„œ ๊ฐ€์žฅ ๋น ๋ฅธ ์†Œํ˜• ๋กœ์ปฌ LLM

Google Gemma 2 2B๋Š” ์ตœ์‹  ๋…ธํŠธ๋ถ CPU์—์„œ ์ดˆ๋‹น 40~60 ํ† ํฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค -- ์ด ํ’ˆ์งˆ ๋“ฑ๊ธ‰์—์„œ ์–ด๋А ๋ชจ๋ธ๋ณด๋‹ค ๋น ๋ฆ…๋‹ˆ๋‹ค. 1.7 GB RAM ์‚ฌ์šฉ๋Ÿ‰์œผ๋กœ RAM 4 GB ๊ธฐ๊ธฐ์—์„œ OS์™€ ๋‹ค๋ฅธ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ์œ„ํ•œ ์ถฉ๋ถ„ํ•œ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ๋‚จ๊น๋‹ˆ๋‹ค.

์ถ”๋ก  ์ž‘์—…์—์„œ์˜ ํ’ˆ์งˆ์€ Phi-4 Mini๋‚˜ Llama 3.2 3B๋ณด๋‹ค ๋‚ฎ์Šต๋‹ˆ๋‹ค. 8K ์ปจํ…์ŠคํŠธ ์ฐฝ(Phi-4 Mini์™€ Llama 3.2์˜ 128K ๋Œ€๋น„)์€ ๊ธด ๋ฌธ์„œ ์ฒ˜๋ฆฌ์— ์‹ค์งˆ์ ์ธ ์ œํ•œ์ด ๋ฉ๋‹ˆ๋‹ค. Gemma 2 2B๋Š” ์ถœ๋ ฅ ํ’ˆ์งˆ๋ณด๋‹ค ์‘๋‹ต ์†๋„๊ฐ€ ๋” ์ค‘์š”ํ•œ ๊ฒฝ์šฐ์— ์ ํ•ฉํ•œ ์„ ํƒ์ž…๋‹ˆ๋‹ค.

SpecValue
MMLU52%
RAM (Q4_K_M)~1.7 GB
์ปจํ…์ŠคํŠธ8K ํ† ํฐ
CPU ์†๋„์ดˆ๋‹น 40~60 ํ† ํฐ
Ollama ๋ช…๋ น์–ดollama run gemma2:2b

Qwen3 3B -- ์ฝ”๋”ฉ ์ž‘์—…์— ์ตœ์ ์ธ ์†Œํ˜• ๋ชจ๋ธ

Qwen3 3B๋Š” HumanEval์—์„œ 65%๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค -- Llama 3.2 3B๋ณด๋‹ค 5ํผ์„ผํŠธํฌ์ธํŠธ ๋†’์•„ 3B ๊ทœ๋ชจ์—์„œ ์ฝ”๋”ฉ ์ž‘์—…์— ์ตœ์ ์˜ ์„ ํƒ์ž…๋‹ˆ๋‹ค. JSON ๋ชจ๋“œ์™€ ํ•จ์ˆ˜ ํ˜ธ์ถœ ์ง€์›์„ ํฌํ•จํ•˜๋ฉฐ, 29๊ฐœ ์–ธ์–ด๋ฅผ ๊ธฐ๋ณธ์œผ๋กœ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

์˜์–ด ๋น„์ฝ”๋”ฉ ์ž‘์—…์—์„œ๋Š” Llama 3.2 3B์™€ Phi-4 Mini๊ฐ€ ๋” ์ž์—ฐ์Šค๋Ÿฌ์šด ์‚ฐ๋ฌธ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋”ฉ์ด๋‚˜ ๋‹ค๊ตญ์–ด ์ถœ๋ ฅ์ด ์ฃผ์š” ์‚ฌ์šฉ ์‚ฌ๋ก€์ธ ๊ฒฝ์šฐ์—๋งŒ Qwen3 3B๋ฅผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.

SpecValue
MMLU62%
HumanEval65%
RAM (Q4_K_M)~2 GB
์ปจํ…์ŠคํŠธ128K ํ† ํฐ
CPU ์†๋„์ดˆ๋‹น 25~40 ํ† ํฐ
Ollama ๋ช…๋ น์–ดollama run qwen2.5:3b

Llama 3.2 3B -- ์ตœ๊ณ  ๋ฒ”์šฉ ์†Œํ˜• ๋ชจ๋ธ

Meta Llama 3.2 3B๋Š” ๊ฐ€์žฅ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ๋ฌธ์„œํ™”๋˜๊ณ  ์ปค๋ฎค๋‹ˆํ‹ฐ์—์„œ ์ง€์›๋˜๋Š” 3B ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. MMLU 58%์™€ HumanEval 60%๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค -- ๋‘ ํ•ญ๋ชฉ ๋ชจ๋‘ Phi-4 Mini๋ณด๋‹ค ์•ฝ๊ฐ„ ๋‚ฎ์ง€๋งŒ -- ๊ฐ€์žฅ ๋„“์€ ๋„๊ตฌ ์ง€์›, ๊ฐ€์žฅ ๋งŽ์€ ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ, ๊ฐ€์žฅ ๋ฐฉ๋Œ€ํ•œ ์ปค๋ฎค๋‹ˆํ‹ฐ ๊ฐ€์ด๋“œ ์ปฌ๋ ‰์…˜์„ ๊ฐ–์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

128K ์ปจํ…์ŠคํŠธ ์ฐฝ์€ ๋” ํฐ Llama 3.x ๋ชจ๋ธ๊ณผ ๋™์ผํ•˜์—ฌ ์ค‘๊ฐ„ ๊ธธ์ด์˜ ๋ฌธ์„œ ์š”์•ฝ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ์ฒซ ๋ฒˆ์งธ ์†Œํ˜• ๋ชจ๋ธ๋กœ๋Š” ์˜ˆ์ธก ๊ฐ€๋Šฅํ•œ ๋™์ž‘๊ณผ ๋ฐฉ๋Œ€ํ•œ ๋ฌธ์„œ๋กœ ์ธํ•ด Llama 3.2 3B๊ฐ€ ๊ฐ€์žฅ ์•ˆ์ „ํ•œ ์„ ํƒ์ž…๋‹ˆ๋‹ค.

SpecValue
MMLU58%
RAM (Q4_K_M)~2.5 GB
์ปจํ…์ŠคํŠธ128K ํ† ํฐ
CPU ์†๋„์ดˆ๋‹น 25~45 ํ† ํฐ
Ollama ๋ช…๋ น์–ดollama run llama3.2:3b

Llama 3.2 1B -- ์œ ์šฉํ•œ ์ถœ๋ ฅ์„ ์œ„ํ•œ ์ ˆ๋Œ€ ์ตœ์†Œ ์‚ฌ์–‘

Llama 3.2 1B๋Š” RAM 1.3 GB๋งŒ ํ•„์š”ํ•˜๋ฉฐ CPU์—์„œ ์ดˆ๋‹น 60~90 ํ† ํฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค -- ๋กœ์ปฌ์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ๊ฐ€์žฅ ๋น ๋ฅธ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ถœ๋ ฅ ํ’ˆ์งˆ์€ ํ•œ๊ณ„ ์ˆ˜์ค€์ž…๋‹ˆ๋‹ค: ๋งค์šฐ ๊ฐ„๋‹จํ•œ ๋ถ„๋ฅ˜์™€ ํ‚ค์›Œ๋“œ ์ถ”์ถœ์€ ์ฒ˜๋ฆฌํ•˜์ง€๋งŒ ์ผ๊ด€์„ฑ ์žˆ๋Š” ์—ฌ๋Ÿฌ ๋ฌธ์žฅ ์‘๋‹ต์—๋Š” ์–ด๋ ค์›€์„ ๊ฒช์Šต๋‹ˆ๋‹ค. 2026๋…„ 4์›” ๊ธฐ์ค€, Llama 3.2 1B๋Š” RAM์ด ์‹ค์ œ๋กœ ์ œ์•ฝ ์š”์ธ์ธ ๊ฒฝ์šฐ(๊ฐ€์šฉ RAM 3 GB ๋ฏธ๋งŒ)๋‚˜ ๋„๊ตฌ ํ†ตํ•ฉ ํ…Œ์ŠคํŠธ ๋ชฉ์ ์œผ๋กœ๋งŒ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

์ „์ฒด ๋น„๊ต: 4B ๋ฏธ๋งŒ ์ตœ๊ณ  ์†Œํ˜• ๋กœ์ปฌ LLM

๋ชจ๋ธMMLUHumanEvalRAM์ปจํ…์ŠคํŠธ์ตœ์  ์šฉ๋„
Phi-4 Mini 3.8B68%70%2.5 GB128K์ถ”๋ก , ์ฝ”๋”ฉ
Qwen3 3B62%65%2 GB128K์ฝ”๋”ฉ, ๋‹ค๊ตญ์–ด
Llama 3.2 3B58%60%2.5 GB128K๋ฒ”์šฉ, ์ฒซ ๋ชจ๋ธ
Gemma 2 2B52%38%1.7 GB8K์†๋„, ๊ทน์ €์šฉ๋Ÿ‰ RAM
Llama 3.2 1B32%28%1.3 GB128K์ ˆ๋Œ€ ์ตœ์†Œ RAM
์„ฑ๋Šฅ ๋“ฑ๊ธ‰: MMLU์™€ HumanEval ์ ์ˆ˜๋Š” Phi-4 Mini๊ฐ€ ์ถ”๋ก ๊ณผ ์ฝ”๋”ฉ์—์„œ ์„ ๋‘์ž„์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. Gemma 2๋Š” CPU์—์„œ ๊ฐ€์žฅ ๋น ๋ฅด๋ฉฐ, Qwen3์€ ์ฝ”๋”ฉ์—์„œ ํƒ์›”ํ•ฉ๋‹ˆ๋‹ค.
์„ฑ๋Šฅ ๋“ฑ๊ธ‰: MMLU์™€ HumanEval ์ ์ˆ˜๋Š” Phi-4 Mini๊ฐ€ ์ถ”๋ก ๊ณผ ์ฝ”๋”ฉ์—์„œ ์„ ๋‘์ž„์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. Gemma 2๋Š” CPU์—์„œ ๊ฐ€์žฅ ๋น ๋ฅด๋ฉฐ, Qwen3์€ ์ฝ”๋”ฉ์—์„œ ํƒ์›”ํ•ฉ๋‹ˆ๋‹ค.

์ง€์—ญ๋ณ„ ์†Œํ˜• ๋กœ์ปฌ LLM

EU / GDPR: ์ œ์•ฝ๋œ ํ•˜๋“œ์›จ์–ด -- ํ˜„์žฅ ์ž‘์—…, ์—์–ด๊ฐญ ํ™˜๊ฒฝ, ๊ตฌํ˜• ๊ธฐ์—… ๋…ธํŠธ๋ถ -- ์—์„œ AI๋ฅผ ์‹คํ–‰ํ•˜๋Š” EU ์ „๋ฌธ๊ฐ€์˜ ๊ฒฝ์šฐ, ์†Œํ˜• ๋กœ์ปฌ ๋ชจ๋ธ์€ ๋ฐ์ดํ„ฐ ์™ธ๋ถ€ ์œ ์ถœ ์—†์ด GDPR ์ค€์ˆ˜ ์ถ”๋ก ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ํ‘œ์ค€ ๊ธฐ์—… ๋…ธํŠธ๋ถ(RAM 8 GB)์—์„œ ์‹คํ–‰๋˜๋Š” Phi-4 Mini 3.8B๋Š” GDPR ์ œ5์กฐ(๋ฐ์ดํ„ฐ ์ตœ์†Œํ™”) ํ•˜์— ์ฒ˜๋ฆฌ๋œ ๋ชจ๋“  ํ…์ŠคํŠธ๋ฅผ ์˜จ๋””๋ฐ”์ด์Šค์— ๋ณด๊ด€ํ•ฉ๋‹ˆ๋‹ค. ๋…์ผ BSI ์ค€์ˆ˜ ๋ฌธ์„œํ™”์˜ ๊ฒฝ์šฐ: Phi-4 Mini(Microsoft, MIT ๋ผ์ด์„ ์Šค)์™€ Llama 3.2 3B(Meta, Llama Community ๋ผ์ด์„ ์Šค) ๋ชจ๋‘ Ollama ํƒœ๊ทธ๋ฅผ ํ†ตํ•ด ๋ฒ„์ „์ด ์ง€์ •๋œ ๋ชจ๋ธ ์‹๋ณ„์ž๋ฅผ ์ œ๊ณตํ•˜์—ฌ AI ๋„๊ตฌ ๋ฌธ์„œํ™” ์š”๊ฑด์„ ์ถฉ์กฑํ•ฉ๋‹ˆ๋‹ค. Mistral์€ ํ˜„์žฌ 4B ๋ฏธ๋งŒ ๋ชจ๋ธ์„ ์ œ๊ณตํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์ด ํฌ๊ธฐ ํด๋ž˜์Šค์—์„œ EU ์ถœ์‹  ๋ชจ๋ธ์„ ์„ ํ˜ธํ•˜๋Š” EU ์กฐ์ง์˜ ๊ฒฝ์šฐ, Mistral์ด 4B ๋ฏธ๋งŒ ๋ฒ„์ „์„ ์ถœ์‹œํ•  ๋•Œ๊นŒ์ง€ ์„ ํƒ์ง€๊ฐ€ ์ œํ•œ์ ์ž…๋‹ˆ๋‹ค.

์ผ๋ณธ (METI): ์†Œํ˜• ๋ชจ๋ธ ๋“ฑ๊ธ‰์—์„œ ์ผ๋ณธ์–ด ์ž‘์—…์˜ ๊ฒฝ์šฐ, Qwen3 3B๊ฐ€ ์ด ๋น„๊ต์—์„œ ๊ธฐ๋ณธ ์ผ๋ณธ์–ด ํ† ํฌ๋‚˜์ด์ œ์ด์…˜์„ ๊ฐ–์ถ˜ ์œ ์ผํ•œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. Llama 3.2 3B๋Š” ์ผ๋ณธ์–ด๋ฅผ ์ฒ˜๋ฆฌํ•˜์ง€๋งŒ ํ† ํฐ ํšจ์œจ์ด ๋‚ฎ์Šต๋‹ˆ๋‹ค. ์ œ์•ฝ๋œ ํ•˜๋“œ์›จ์–ด์—์„œ ์ผ๋ณธ์–ด ์š”์•ฝ์ด๋‚˜ ๋ฒˆ์—ญ์˜ ๊ฒฝ์šฐ: `ollama run qwen2.5:3b`. ์†Œํ˜• ๋ชจ๋ธ์˜ ์†๋„ ์ด์ ์€ ์ผ๋ณธ ๊ธฐ์—… ์‚ฌ์šฉ์— ํŠนํžˆ ๊ด€๋ จ์„ฑ์ด ์žˆ์Šต๋‹ˆ๋‹ค: CPU์—์„œ ์ดˆ๋‹น 25~40 ํ† ํฐ์€ ํ‘œ์ค€ ์‚ฌ๋ฌด์šฉ ํ•˜๋“œ์›จ์–ด์˜ ์ฑ„ํŒ… ์ธํ„ฐํŽ˜์ด์Šค์— ์ ์ ˆํ•œ ์‹ค์‹œ๊ฐ„ ์‘๋‹ต์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์ค‘๊ตญ: Qwen3 3B(์•Œ๋ฆฌ๋ฐ”๋ฐ”, Apache 2.0)๋Š” ์ค‘๊ตญ์–ด ์†Œํ˜• ๋ชจ๋ธ ๋ฐฐํฌ์˜ ์ž์—ฐ์Šค๋Ÿฌ์šด ์„ ํƒ์ž…๋‹ˆ๋‹ค. ๊ธฐ๋ณธ ์ค‘๊ตญ์–ด ํ† ํฌ๋‚˜์ด์ œ์ด์…˜์€ ๋™๋“ฑํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜์—์„œ Llama๋ณด๋‹ค ์ค‘๊ตญ์–ด ํ…์ŠคํŠธ๋ฅผ 30~40% ๋” ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค. ์ค‘๊ตญ์˜ ๋ฐ์ดํ„ฐ ์•ˆ์ „๋ฒ•(ๆ•ฐๆฎๅฎ‰ๅ…จๆณ•) ํ•˜์—์„œ IoT ๋ฐ ์—ฃ์ง€ ๋ฐฐํฌ์˜ ๊ฒฝ์šฐ: `ollama run qwen2.5:3b`๋Š” RAM 4 GB์˜ ๋ชจ๋“  Linux ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰๋˜๋ฉฐ ์™ธ๋ถ€ API ํ˜ธ์ถœ ์—†์ด ์˜จ๋””๋ฐ”์ด์Šค๋กœ ๋ชจ๋“  ํ…์ŠคํŠธ๋ฅผ ์ฒ˜๋ฆฌํ•ฉ๋‹ˆ๋‹ค.

์†Œํ˜• ๋กœ์ปฌ LLM ์‹คํ–‰ ์‹œ ํ”ํ•œ ์‹ค์ˆ˜๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

  • Q4_K_M ๋Œ€์‹  Q8_0 ์–‘์žํ™” ์‚ฌ์šฉ: Q8_0์€ ์†Œํ˜• ๋ชจ๋ธ์—์„œ ํ’ˆ์งˆ ๊ฐœ์„ ์ด ๋ฏธ๋ฏธํ•จ์—๋„ Q4_K_M ๋Œ€๋น„ ๊ฑฐ์˜ ๋‘ ๋ฐฐ์˜ RAM์„ ํ•„์š”๋กœ ํ•ฉ๋‹ˆ๋‹ค. Q8_0์˜ Llama 3.2 3B ๋ชจ๋ธ์€ Q4_K_M์˜ ~2.5 GB ๋Œ€๋น„ ~3.8 GB์˜ RAM์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. RAM 4 GB ๊ธฐ๊ธฐ์—์„œ Q8_0์€ ์Šค์™‘ ์‚ฌ์šฉ์„ ์œ ๋ฐœํ•˜์—ฌ ์ถ”๋ก  ์†๋„๋ฅผ 3~5๋ฐฐ ๋А๋ฆฌ๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. 4B ๋ฏธ๋งŒ ๋ชจ๋ธ์—๋Š” ํ•ญ์ƒ Q4_K_M์„ ๊ธฐ๋ณธ๊ฐ’์œผ๋กœ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • instruct ๋ฒ„์ „ ๋Œ€์‹  ๋ฒ ์ด์Šค ๋ชจ๋ธ ์‹คํ–‰: ๋ฒ ์ด์Šค ๋ชจ๋ธ(์˜ˆ: `llama3.2:3b-text`)์€ ํŒŒ์ธํŠœ๋‹ ์ด์ „์˜ ์ฒดํฌํฌ์ธํŠธ๋กœ, ํ…์ŠคํŠธ์˜ ๋‹ค์Œ ํ† ํฐ์„ ์˜ˆ์ธกํ•˜๋„๋ก ํ•™์Šต๋œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ์ง€์‹œ๋ฅผ ๋”ฐ๋ฅด์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋ฒ ์ด์Šค ๋ชจ๋ธ์— "2+2๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?"๋ผ๊ณ  ๋ฌผ์œผ๋ฉด "4"๋ผ๊ณ  ๋‹ตํ•˜๋Š” ๋Œ€์‹  ํ€ด์ฆˆ ํ˜•์‹์œผ๋กœ ๋ฌธ์žฅ์„ ์™„์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•ญ์ƒ instruct ๋ฒ„์ „์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค: `llama3.2:3b` (Ollama๋Š” ์ด๋ฆ„์ด ์ง€์ •๋œ ๋ชจ๋ธ์— ๋Œ€ํ•ด ๊ธฐ๋ณธ์ ์œผ๋กœ instruct๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค).
  • 3B ๋ชจ๋ธ์— 7B ๋ชจ๋ธ ์ˆ˜์ค€์˜ ํ’ˆ์งˆ ๊ธฐ๋Œ€: MMLU 68%์˜ 3B ๋ชจ๋ธ(Phi-4 Mini)์€ ์ผ๋ฐ˜ ์ž‘์—…์—์„œ 2023๋…„ GPT-3.5 Mini์™€ ์œ ์‚ฌํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค. ๋ณต์žกํ•œ ์ถ”๋ก  ์—ฐ์‡„, ์žฅ๋ฌธ ์ž‘์„ฑ, ์„ธ๋ฐ€ํ•œ ์ฝ”๋“œ ์ƒ์„ฑ์€ 7B ๋ชจ๋ธ๋ณด๋‹ค ๋ˆˆ์— ๋„๊ฒŒ ๋‚ฎ์€ ํ’ˆ์งˆ์„ ๋ณด์ผ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ถœ๋ ฅ ํ’ˆ์งˆ์ด ์ถฉ๋ถ„ํ•˜์ง€ ์•Š๋‹ค๋ฉด 7B ๋ชจ๋ธ๋กœ ์—…๊ทธ๋ ˆ์ด๋“œํ•˜์‹ญ์‹œ์˜ค -- RAM ์ฐจ์ด๋Š” ์•ฝ 2 GB(2.5 GB โ†’ 4.5 GB)์ž…๋‹ˆ๋‹ค.

์–‘์žํ™” ์ดํ•ด: RAM ๋Œ€ ํ’ˆ์งˆ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„

์–‘์žํ™” ํŠธ๋ ˆ์ด๋“œ์˜คํ”„: Q4_K_M(2.5 GB, ํ’ˆ์งˆ -0.5%)์ด ๊ถŒ์žฅ ๊ธฐ๋ณธ๊ฐ’์ž…๋‹ˆ๋‹ค. Q8_0์€ ํ’ˆ์งˆ ํ–ฅ์ƒ ์—†์ด 3.8 GB๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ทน๋„๋กœ RAM์ด ์ œํ•œ๋œ ๊ฒฝ์šฐ Q3_K_M(1.8 GB, ํ’ˆ์งˆ ์†์‹ค -1.8%)์„ ๊ณ ๋ คํ•˜์‹ญ์‹œ์˜ค.
์–‘์žํ™” ํŠธ๋ ˆ์ด๋“œ์˜คํ”„: Q4_K_M(2.5 GB, ํ’ˆ์งˆ -0.5%)์ด ๊ถŒ์žฅ ๊ธฐ๋ณธ๊ฐ’์ž…๋‹ˆ๋‹ค. Q8_0์€ ํ’ˆ์งˆ ํ–ฅ์ƒ ์—†์ด 3.8 GB๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ทน๋„๋กœ RAM์ด ์ œํ•œ๋œ ๊ฒฝ์šฐ Q3_K_M(1.8 GB, ํ’ˆ์งˆ ์†์‹ค -1.8%)์„ ๊ณ ๋ คํ•˜์‹ญ์‹œ์˜ค.

์†Œํ˜• ๋กœ์ปฌ LLM ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ผ๋ฐ˜์ ์ธ ์งˆ๋ฌธ

์œ ์šฉํ•œ ์ถœ๋ ฅ์„ ์ƒ์„ฑํ•˜๋Š” ๊ฐ€์žฅ ์ž‘์€ ๋กœ์ปฌ LLM์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

2026๋…„ 4์›” ๊ธฐ์ค€์œผ๋กœ, ์œ ์šฉํ•œ ์ถœ๋ ฅ์„ ์œ„ํ•œ ์‹ค์งˆ์ ์ธ ์ตœ์†Œ ์‚ฌ์–‘์€ Q4_K_M ์–‘์žํ™”์˜ 3B ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. 2B ๋ฏธ๋งŒ ํŒŒ๋ผ๋ฏธํ„ฐ ๋ชจ๋ธ(Llama 3.2 1B, Gemma 2 2B)์€ ์ผ๊ด€์„ฑ ์žˆ๋Š” ๋‹จ์ผ ๋ฌธ์žฅ์„ ์ƒ์„ฑํ•˜์ง€๋งŒ ๋‹ค๋‹จ๊ณ„ ์ง€์‹œ, ๊ธด ์‘๋‹ต, ๋ณต์žกํ•œ ์ถ”๋ก ์— ์–ด๋ ค์›€์„ ๊ฒช์Šต๋‹ˆ๋‹ค. ์š”์•ฝ์ด๋‚˜ ๊ฐ„๋‹จํ•œ Q&A์™€ ๊ฐ™์€ ์ž‘์—…์—๋Š” Gemma 2 2B๊ฐ€ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋” ๋ณต์žกํ•œ ์ž‘์—…์—๋Š” 3B ๋ชจ๋ธ๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค.

3B ๋ชจ๋ธ์„ ์Šค๋งˆํŠธํฐ์—์„œ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์˜ˆ -- Llama 3.2 1B์™€ 3B๋Š” ์˜จ๋””๋ฐ”์ด์Šค ๋ชจ๋ฐ”์ผ ๋ฐฐํฌ๋ฅผ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ์„ค๊ณ„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Meta๋Š” iOS(MLC LLM ๊ฒฝ์œ )์™€ Android์šฉ ์ตœ์ ํ™” ๋นŒ๋“œ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ตœ์‹  ์Šค๋งˆํŠธํฐ(Snapdragon 8 Gen 3 ๋˜๋Š” Apple A17 Pro)์—์„œ์˜ ์ถ”๋ก ์€ 1B ๋ชจ๋ธ ๊ธฐ์ค€ ์ดˆ๋‹น 15~30 ํ† ํฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. LM Studio์™€ Ollama๋Š” ํ˜„์žฌ iOS ๋ฐ Android์—์„œ ์‹คํ–‰๋˜์ง€ ์•Š์œผ๋ฉฐ, ๋ชจ๋ฐ”์ผ์—๋Š” ๋ณ„๋„์˜ ํ”„๋ ˆ์ž„์›Œํฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

์†Œํ˜• ๋ชจ๋ธ์€ ์š”์•ฝ ์ž‘์—…์— ์ ํ•ฉํ•ฉ๋‹ˆ๊นŒ?

์˜ˆ -- ์š”์•ฝ์€ ์†Œํ˜• ๋ชจ๋ธ์˜ ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ์‚ฌ์šฉ ์‚ฌ๋ก€ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. Gemma 2 2B์™€ Llama 3.2 3B๋Š” ์•ฝ 4,000๋‹จ์–ด๊นŒ์ง€์˜ ํ…์ŠคํŠธ ์š”์•ฝ์„(ํ’ˆ์งˆ ์ถœ๋ ฅ์˜ ์‹ค์งˆ์  ์ปจํ…์ŠคํŠธ ํ•œ๊ณ„) ์•ˆ์ •์ ์œผ๋กœ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๋” ๊ธด ๋ฌธ์„œ์˜ ๊ฒฝ์šฐ Phi-4 Mini๋‚˜ Llama 3.2 3B(๋‘˜ ๋‹ค 128K ํ† ํฐ)์™€ ๊ฐ™์ด ํฐ ์ปจํ…์ŠคํŠธ ์ฐฝ์„ ๊ฐ€์ง„ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๋™์ผํ•œ ํ•˜๋“œ์›จ์–ด์—์„œ 2B ๋ชจ๋ธ์€ 7B ๋ชจ๋ธ๋ณด๋‹ค ์–ผ๋งˆ๋‚˜ ๋น ๋ฆ…๋‹ˆ๊นŒ?

CPU์—์„œ ์•ฝ 2~3๋ฐฐ ๋น ๋ฆ…๋‹ˆ๋‹ค. Gemma 2 2B๋Š” ๋™์ผํ•œ ๋…ธํŠธ๋ถ CPU์—์„œ Mistral Small ๋Œ€๋น„ ์ดˆ๋‹น 40~60 ํ† ํฐ ๋Œ€ 10~20 ํ† ํฐ์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. GPU์—์„œ๋Š” GPU ์ฒ˜๋ฆฌ๋Ÿ‰์ด ๋ชจ๋ธ ํฌ๊ธฐ์— ๋œ ์ œ์•ฝ๋ฐ›๊ธฐ ๋•Œ๋ฌธ์— ์†๋„ ์ด์ ์ด ์ค„์–ด๋“ญ๋‹ˆ๋‹ค. ์†๋„ ์ฐจ์ด๋Š” CPU ์ „์šฉ ๊ธฐ๊ธฐ์—์„œ ๊ฐ€์žฅ ๋‘๋“œ๋Ÿฌ์ง‘๋‹ˆ๋‹ค.

์†Œํ˜• ๋ชจ๋ธ์€ ํ•จ์ˆ˜ ํ˜ธ์ถœ์„ ์ง€์›ํ•ฉ๋‹ˆ๊นŒ?

์ผ๋ถ€ ๋ชจ๋ธ์€ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. Qwen3 3B๋Š” ํ•จ์ˆ˜ ํ˜ธ์ถœ๊ณผ JSON ๋ชจ๋“œ๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. Llama 3.2 3B๋Š” ๊ธฐ๋ณธ์ ์ธ ๋„๊ตฌ ์‚ฌ์šฉ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. Gemma 2 2B๋Š” ํ•จ์ˆ˜ ํ˜ธ์ถœ์„ ์ง€์›ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ตฌ์กฐํ™”๋œ ์ถœ๋ ฅ์— ์˜์กดํ•˜๋Š” ํŒŒ์ดํ”„๋ผ์ธ์„ ๊ตฌ์ถ•ํ•˜๊ธฐ ์ „์— ๋ชจ๋ธ ๋ฌธ์„œ๋ฅผ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

์˜์–ด ์™ธ ์–ธ์–ด์— ๊ฐ€์žฅ ์ ํ•ฉํ•œ ์†Œํ˜• ๋ชจ๋ธ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Qwen3 3B๋Š” ์ค‘๊ตญ์–ด, ์ผ๋ณธ์–ด, ํ•œ๊ตญ์–ด, ์•„๋ž์–ด๋ฅผ ํฌํ•จํ•˜์—ฌ 29๊ฐœ ์–ธ์–ด๋ฅผ ๊ธฐ๋ณธ์œผ๋กœ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. Gemma 2 2B์™€ Phi-4 Mini๋Š” ์ฃผ๋กœ ์˜์–ด์— ์ตœ์ ํ™”๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. ์†Œํ˜• ๋ชจ๋ธ ๊ทœ๋ชจ์—์„œ ๋น„์˜์–ด ์ž‘์—…์—๋Š” Qwen3 3B๊ฐ€ ๋ช…ํ™•ํ•œ ์„ ํƒ์ž…๋‹ˆ๋‹ค. ์ „์ฒด ์–ธ์–ด ๋น„๊ต๋Š” Qwen vs Llama vs Mistral ๋‹ค๊ตญ์–ด ๋น„๊ต๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

์ผ์ƒ์ ์ธ ์ž‘์—…์—์„œ Phi-4 Mini์™€ Llama 3.2 3B์˜ ์ฐจ์ด๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Phi-4 Mini๋Š” ๊ฑฐ์˜ ๋™์ผํ•œ RAM(๊ฐ 2.5 GB)์œผ๋กœ ์ถ”๋ก , ์ˆ˜ํ•™, ์ฝ”๋”ฉ์—์„œ Llama 3.2 3B๋ฅผ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค(MMLU 68% ๋Œ€ 58%, HumanEval 70% ๋Œ€ 60%). Q&A, ์š”์•ฝ, ๊ฐ„๋‹จํ•œ ์„ค๋ช… ๋“ฑ ์ผ์ƒ์ ์ธ ์ž‘์—…์—์„œ๋Š” ํ’ˆ์งˆ ์ฐจ์ด๊ฐ€ ๋ˆˆ์— ๋„์ง€๋งŒ ๊ทน์ ์ด์ง€๋Š” ์•Š์Šต๋‹ˆ๋‹ค. Llama 3.2 3B๋Š” ๋” ๋„“์€ ์ปค๋ฎค๋‹ˆํ‹ฐ ์ง€์›๊ณผ ๋” ๋งŽ์€ ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ์„ ๊ฐ–์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ตฌ์กฐํ™”๋œ ์ถ”๋ก ์—๋Š” Phi-4 Mini๋ฅผ, ์ผ๋ฐ˜ ์ฑ„ํŒ…๊ณผ ๊ด‘๋ฒ”์œ„ํ•œ ํ˜ธํ™˜์„ฑ์—๋Š” Llama 3.2 3B๋ฅผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค.

๋‘ ๊ฐœ์˜ ์†Œํ˜• ๋ชจ๋ธ์„ ๋™์‹œ์— ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์˜ˆ, ์ด RAM์ด ํ—ˆ์šฉํ•˜๋Š” ๊ฒฝ์šฐ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. Q4_K_M์˜ 3B ๋ชจ๋ธ ๋‘ ๊ฐœ๋Š” ํ•ฉ์ณ์„œ ~5 GB๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค -- ๊ฒฝ๋Ÿ‰ OS๋ฅผ ๊ฐ–์ถ˜ 8 GB ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. Ollama๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ ํ”„๋กœ์„ธ์Šค๋‹น ํ•œ ๋ฒˆ์— ํ•˜๋‚˜์˜ ๋ชจ๋ธ์„ ๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค. ๋‘ ๊ฐœ์˜ Ollama ์ธ์Šคํ„ด์Šค๋ฅผ ๋‹ค๋ฅธ ํฌํŠธ์—์„œ ์‹คํ–‰ํ•˜์—ฌ(OLLAMA_HOST=:11434 ๋ฐ OLLAMA_HOST=:11435) ๋‘ ๋ชจ๋ธ์„ ๋ณ‘๋ ฌ๋กœ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ถœ๋ ฅ A/B ํ…Œ์ŠคํŠธ์— ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.

์†Œํ˜• ๋ชจ๋ธ์€ RAG(๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ)์— ์ ํ•ฉํ•ฉ๋‹ˆ๊นŒ?

๊ฐ„๋‹จํ•œ RAG์—๋Š” ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. Llama 3.2 3B์™€ Phi-4 Mini๋Š” ๊ฒ€์ƒ‰๋œ ๋ฌธ์„œ ์ฒญํฌ์— ๋Œ€ํ•œ ์งˆ๋ฌธ์— ์•ˆ์ •์ ์œผ๋กœ ๋‹ต๋ณ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฉ€ํ‹ฐํ™‰ ์ถ”๋ก ์ด ํ•„์š”ํ•œ ๋Œ€๊ทœ๋ชจ ์ง€์‹ ๋ฒ ์ด์Šค์— ๋Œ€ํ•œ RAG์˜ ๊ฒฝ์šฐ 7B ์ด์ƒ ๋ชจ๋ธ์ด ๋” ์ผ๊ด€์„ฑ ์žˆ๊ฒŒ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•ฉ๋‹ˆ๋‹ค. GPT4All์˜ LocalDocs ๊ธฐ๋Šฅ์€ ๋ฌธ์„œ Q&A์— 3B ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋ฉฐ ๊ฐœ์ธ ๋ฌธ์„œ ์ปฌ๋ ‰์…˜์— ์ž˜ ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.

์ฝ”๋”ฉ์—์„œ Phi-4 Mini๊ฐ€ Llama 3.2 3B๋ณด๋‹ค ์šฐ์ˆ˜ํ•ฉ๋‹ˆ๊นŒ?

์˜ˆ. Phi-4 Mini๋Š” HumanEval์—์„œ 70%๋ฅผ ๊ธฐ๋กํ•˜๋Š” ๋ฐ˜๋ฉด Llama 3.2 3B๋Š” 60%์ž…๋‹ˆ๋‹ค -- ์ด ๊ทœ๋ชจ์—์„œ ์˜๋ฏธ ์žˆ๋Š” 10ํฌ์ธํŠธ ์ฐจ์ด์ž…๋‹ˆ๋‹ค. RAM 4~6 GB ๊ธฐ๊ธฐ์—์„œ ์ฝ”๋”ฉ ์ง€์›์—๋Š” Phi-4 Mini๊ฐ€ ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค. ๋‹ค๊ตญ์–ด ์ฝ”๋”ฉ(Python ์™ธ)์˜ ๊ฒฝ์šฐ HumanEval 65%์˜ Qwen3 3B๊ฐ€ ํ•จ์ˆ˜ ํ˜ธ์ถœ๋„ ์ง€์›ํ•˜๋ฉด์„œ Phi-4 Mini์™€ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์„ฑ๋Šฅ์„ ๋ณด์ž…๋‹ˆ๋‹ค.

์ถœ์ฒ˜

  • Hugging Face Open LLM Leaderboard -- open-llm-leaderboard.hf.space (MMLU ๋ฐ HumanEval ์ ์ˆ˜)
  • Microsoft Phi-4 ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ -- microsoft.com/en-us/research/publication/phi-4-technical-report/
  • Meta Llama 3.2 ๋ชจ๋ธ ์นด๋“œ -- huggingface.co/meta-llama/Llama-3.2-3B-Instruct
  • Google Gemma 2 ๊ธฐ์ˆ  ๋ณด๊ณ ์„œ -- storage.googleapis.com/deepmind-media/gemma/gemma-2-report.pdf

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Run PromptQuorum with a local LLM, your own API keys, or both โ€” you pick the backend.

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

์†Œํ˜• ๋กœ์ปฌ LLM ๋ชจ๋ธ 2026: ์ƒ์œ„ 5๊ฐœ 4B ๋ฏธ๋งŒ ์ˆœ์œ„ | PromptQuorum