Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/์ฝ”๋”ฉ ์›Œํฌํ”Œ๋กœ๋ฅผ ์œ„ํ•œ ๋กœ์ปฌ LLM: ์ฝ”๋“œ ์ƒ์„ฑ, ๋ฆฌ๋ทฐ, ํ…Œ์ŠคํŠธ
Advanced Techniques

์ฝ”๋”ฉ ์›Œํฌํ”Œ๋กœ๋ฅผ ์œ„ํ•œ ๋กœ์ปฌ LLM: ์ฝ”๋“œ ์ƒ์„ฑ, ๋ฆฌ๋ทฐ, ํ…Œ์ŠคํŠธ

ยท11๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

๋กœ์ปฌ LLM์€ ์ฝ”๋”ฉ์„ ๋ณด์กฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ณด์ผ๋Ÿฌํ”Œ๋ ˆ์ดํŠธ ์ƒ์„ฑ, ์ฝ”๋“œ ๋ฆฌ๋ทฐ, ํ…Œ์ŠคํŠธ ์ž‘์„ฑ, ํ•จ์ˆ˜ ์„ค๋ช… ๋“ฑ์˜ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. 2026๋…„ 4์›” ๊ธฐ์ค€, Qwen3-Coder 32B(92.7% HumanEval) ๋ฐ CodeLlama 34B(75% HumanEval)์™€ ๊ฐ™์€ ๋ชจ๋ธ์€ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๋ฒค์น˜๋งˆํฌ์—์„œ ์ตœ๊ณ  ์ˆ˜์ค€์˜ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM์€ ์ฝ”๋”ฉ์„ ๋ณด์กฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ณด์ผ๋Ÿฌํ”Œ๋ ˆ์ดํŠธ ์ƒ์„ฑ, ์ฝ”๋“œ ๋ฆฌ๋ทฐ, ํ…Œ์ŠคํŠธ ์ž‘์„ฑ, ํ•จ์ˆ˜ ์„ค๋ช… ๋“ฑ์˜ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•ฉ๋‹ˆ๋‹ค. 2026๋…„ 4์›” ๊ธฐ์ค€, Qwen3-Coder 32B ๋ฐ CodeLlama 34B์™€ ๊ฐ™์€ ๋ชจ๋ธ์€ HumanEval ๋ฒค์น˜๋งˆํฌ์—์„œ 72~92.7%์˜ ์ •ํ™•๋„๋ฅผ ๋‹ฌ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์†๋„๋Š” ํด๋ผ์šฐ๋“œ๋ณด๋‹ค ๋А๋ฆฌ์ง€๋งŒ(์‘๋‹ต๋‹น 2~5์ดˆ), ์ฝ”๋“œ๊ฐ€ ์™ธ๋ถ€๋กœ ์œ ์ถœ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

Slide Deck: ์ฝ”๋”ฉ ์›Œํฌํ”Œ๋กœ๋ฅผ ์œ„ํ•œ ๋กœ์ปฌ LLM: ์ฝ”๋“œ ์ƒ์„ฑ, ๋ฆฌ๋ทฐ, ํ…Œ์ŠคํŠธ

์•„๋ž˜ ์Šฌ๋ผ์ด๋“œ ๋ฑ์€ ์ตœ๊ณ ์˜ ๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ(Qwen3-Coder 92.7%, CodeLlama 75%), ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง์„ ํ™œ์šฉํ•œ ์ฝ”๋“œ ์ƒ์„ฑ, ์ฝ”๋“œ ๋ฆฌ๋ทฐ ์›Œํฌํ”Œ๋กœ, ํ…Œ์ŠคํŠธ ์ƒ์„ฑ, VS Code/Cursor IDE ์—ฐ๋™, ๊ทธ๋ฆฌ๊ณ  ํ”ผํ•ด์•ผ ํ•  ํ”ํ•œ ์‹ค์ˆ˜๋“ค์„ ๋‹ค๋ฃน๋‹ˆ๋‹ค. PDF๋ฅผ ๋กœ์ปฌ ์ฝ”๋”ฉ AI ์ฐธ๊ณ  ์นด๋“œ๋กœ ๋‹ค์šด๋กœ๋“œํ•˜์„ธ์š”.

Browse the slides below or download as PDF for offline reference. Download Reference Card (PDF)

Key Takeaways

  • ์ตœ๊ณ ์˜ ์ฝ”๋”ฉ ๋ชจ๋ธ (2026): Qwen3-Coder 32B (92.7% HumanEval), Qwen3-Coder 7B (72% HumanEval), CodeLlama 34B (75%).
  • ์†๋„: ์ฝ”๋“œ ์ œ์•ˆ๋‹น 2~5์ดˆ. ๊ฐœ๋ฐœ์— ์ถฉ๋ถ„ํžˆ ๋น ๋ฅด์ง€๋งŒ GitHub Copilot(~300ms)๋ณด๋‹ค๋Š” ๋А๋ฆฝ๋‹ˆ๋‹ค.
  • ํ”„๋ผ์ด๋ฒ„์‹œ: ์ฝ”๋“œ๊ฐ€ ์ ˆ๋Œ€ ์™ธ๋ถ€๋กœ ์ „์†ก๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋…์  ์ฝ”๋“œ๋ฒ ์ด์Šค์— ๋งค์šฐ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.
  • ์‚ฌ์šฉ ์‚ฌ๋ก€: ๋ณด์ผ๋Ÿฌํ”Œ๋ ˆ์ดํŠธ ์ƒ์„ฑ, ์ฝ”๋“œ ๋ฆฌ๋ทฐ, ํ…Œ์ŠคํŠธ ์ž‘์„ฑ, ๋ฌธ์„œํ™”. ๋ณต์žกํ•œ ์•„ํ‚คํ…์ฒ˜ ๊ฒฐ์ •์—๋Š” ์ ํ•ฉํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.
  • 2026๋…„ 4์›” ๊ธฐ์ค€, ๋กœ์ปฌ ์ฝ”๋”ฉ AI๋Š” ๊ฐœ์ธ ๊ฐœ๋ฐœ์ž ๋ฐ ์†Œ๊ทœ๋ชจ ํŒ€์— ์‹ค์šฉ์ ์œผ๋กœ ํ™œ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ ์ฝ”๋”ฉ์— ๊ฐ€์žฅ ์ ํ•ฉํ•œ ๋ชจ๋ธ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

์ตœ๊ณ ์˜ ๋กœ์ปฌ ์ฝ”๋”ฉ ๋ชจ๋ธ์€ ์ •ํ™•๋„, ์†๋„, ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์˜ ๊ท ํ˜•์„ ๊ฐ–์ถฐ์•ผ ํ•ฉ๋‹ˆ๋‹ค. Qwen3-Coder 32B๊ฐ€ ์ •ํ™•๋„(92.7%)์—์„œ ์„ ๋‘๋ฅผ ๋‹ฌ๋ฆฌ๋ฉฐ, Qwen3-Coder 7B๋Š” ์†๋„์™€ ํ’ˆ์งˆ์˜ ์ตœ์  ๊ท ํ˜•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

ModelHumanEval %VRAM์ถ”๋ก  ์†๋„์ ํ•ฉํ•œ ์šฉ๋„
Qwen3-Coder 32Bโ€”22 GBโ€”โ€”
CodeLlama 34Bโ€”22 GBโ€”โ€”
Qwen3-Coder 7Bโ€”4.7 GBโ€”โ€”
DeepSeek-Coder 6.7Bโ€”4 GBโ€”โ€”

๐Ÿ’กTip: ํŒ: VRAM์ด 4~6 GB๋ผ๋ฉด Qwen3-Coder 7B(72% ์ •ํ™•๋„)๋กœ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค. ์ตœ๋Œ€ ์ •ํ™•๋„๋ฅผ ์›ํ•˜์‹ ๋‹ค๋ฉด 24 GB+ VRAM์—์„œ Qwen3-Coder 32B(92.7% ์ •ํ™•๋„)๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. CodeLlama 34B๋Š” 75% ์ •ํ™•๋„์˜ ์•ˆ์ •์ ์ธ ์ค‘๊ฐ„ ์„ ํƒ์ง€์ž…๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM์œผ๋กœ ์ฝ”๋“œ๋ฅผ ์–ด๋–ป๊ฒŒ ์ƒ์„ฑํ•ฉ๋‹ˆ๊นŒ?

ํ•จ์ˆ˜ ์‹œ๊ทธ๋‹ˆ์ฒ˜์™€ docstring์„ ์ œ๊ณตํ•˜๋ฉด ๋ชจ๋ธ์ด ๊ตฌํ˜„์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋“œ ํ’ˆ์งˆ์€ ํ”„๋กฌํ”„ํŠธ ์ปจํ…์ŠคํŠธ์— ํฌ๊ฒŒ ์ขŒ์šฐ๋ฉ๋‹ˆ๋‹ค.

โŒ ๋‚˜์œ ํ”„๋กฌํ”„ํŠธ

โ€œ๋ฐฐ์—ด ๋ณ‘ํ•ฉ ์ฝ”๋“œ๋ฅผ ์ƒ์„ฑํ•˜์„ธ์š”โ€

โœ… ์ข‹์€ ํ”„๋กฌํ”„ํŠธ

โ€œํˆฌ ํฌ์ธํ„ฐ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜์—ฌ merge_sorted_arrays(arr1: List[int], arr2: List[int]) -> List[int]๋ฅผ ๊ตฌํ˜„ํ•˜์„ธ์š”. Docstring: ๋‘ ๊ฐœ์˜ ์ •๋ ฌ๋œ ๋ฐฐ์—ด์„ ํ•˜๋‚˜์˜ ์ •๋ ฌ๋œ ๋ฐฐ์—ด๋กœ ๋ณ‘ํ•ฉํ•ฉ๋‹ˆ๋‹ค.โ€
python
# ์ฝ”๋“œ ์ƒ์„ฑ์„ ์œ„ํ•œ ํ”„๋กฌํ”„ํŠธ ์„ค๊ณ„
prompt = """
๋‹ค์Œ ํ•จ์ˆ˜๋ฅผ ๊ตฌํ˜„ํ•˜์„ธ์š”:

def merge_sorted_arrays(arr1: List[int], arr2: List[int]) -> List[int]:
    \"\""
    ๋‘ ๊ฐœ์˜ ์ •๋ ฌ๋œ ๋ฐฐ์—ด์„ ํ•˜๋‚˜์˜ ์ •๋ ฌ๋œ ๋ฐฐ์—ด๋กœ ๋ณ‘ํ•ฉํ•ฉ๋‹ˆ๋‹ค.
    Args:
        arr1: ์ฒซ ๋ฒˆ์งธ ์ •๋ ฌ๋œ ๋ฐฐ์—ด
        arr2: ๋‘ ๋ฒˆ์งธ ์ •๋ ฌ๋œ ๋ฐฐ์—ด
    Returns:
        ๋ณ‘ํ•ฉ๋œ ์ •๋ ฌ ๋ฐฐ์—ด
    \"\""
    # ๊ตฌํ˜„:
"""

# ๋ชจ๋ธ์ด ๊ตฌํ˜„์„ ์ถœ๋ ฅํ•ฉ๋‹ˆ๋‹ค
# ์˜ˆ์ƒ: ํˆฌ ํฌ์ธํ„ฐ ๋ณ‘ํ•ฉ ์•Œ๊ณ ๋ฆฌ์ฆ˜
์ฝ”๋“œ ์ƒ์„ฑ ์›Œํฌํ”Œ๋กœ: ํ•จ์ˆ˜ ์‹œ๊ทธ๋‹ˆ์ฒ˜์™€ docstring์ด ํฌํ•จ๋œ ์ƒ์„ธ ํ”„๋กฌํ”„ํŠธ ์ž‘์„ฑ โ†’ Qwen3-Coder ๋˜๋Š” CodeLlama 7B ๋ชจ๋ธ์— ์ „์†ก โ†’ ๋ชจ๋ธ์ด ๊ตฌํ˜„ ์ƒ์„ฑ โ†’ ๋ฒ„๊ทธ ๊ฒ€ํ†  โ†’ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ํ†ตํ•ฉ. 5๋‹จ๊ณ„ ๋ชจ๋‘ ํ•„์ˆ˜์ž…๋‹ˆ๋‹ค.
์ฝ”๋“œ ์ƒ์„ฑ ์›Œํฌํ”Œ๋กœ: ํ•จ์ˆ˜ ์‹œ๊ทธ๋‹ˆ์ฒ˜์™€ docstring์ด ํฌํ•จ๋œ ์ƒ์„ธ ํ”„๋กฌํ”„ํŠธ ์ž‘์„ฑ โ†’ Qwen3-Coder ๋˜๋Š” CodeLlama 7B ๋ชจ๋ธ์— ์ „์†ก โ†’ ๋ชจ๋ธ์ด ๊ตฌํ˜„ ์ƒ์„ฑ โ†’ ๋ฒ„๊ทธ ๊ฒ€ํ†  โ†’ ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์— ํ†ตํ•ฉ. 5๋‹จ๊ณ„ ๋ชจ๋‘ ํ•„์ˆ˜์ž…๋‹ˆ๋‹ค.

๐Ÿ”Insight: ๐Ÿ“ ํ•ต์‹ฌ ์ธ์‚ฌ์ดํŠธ: ์‚ฐ๋ฌธ๋ณด๋‹ค ํ•จ์ˆ˜ ์‹œ๊ทธ๋‹ˆ์ฒ˜๊ฐ€ ๋” ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์„ ์•ˆ๋‚ดํ•˜๊ธฐ ์œ„ํ•ด ํƒ€์ž…, docstring, ์ž…์ถœ๋ ฅ ์˜ˆ์‹œ๋ฅผ ํฌํ•จํ•˜์‹ญ์‹œ์˜ค.

๋กœ์ปฌ LLM์œผ๋กœ ์ฝ”๋“œ๋ฅผ ์–ด๋–ป๊ฒŒ ๋ฆฌ๋ทฐํ•ฉ๋‹ˆ๊นŒ?

๋ฒ„๊ทธ, ์Šคํƒ€์ผ, ์„ฑ๋Šฅ์„ ๊ฒ€ํ† ํ•˜๋„๋ก ๋ชจ๋ธ์— ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž…๋ ฅํ•˜์‹ญ์‹œ์˜ค. ๋กœ์ปฌ ๋ชจ๋ธ์€ ์ผ๋ฐ˜์ ์ธ ์‹ค์ˆ˜๋ฅผ ์žก์•„๋‚ด๋Š” ๋ฐ ํƒ์›”ํ•˜์ง€๋งŒ ์•„ํ‚คํ…์ฒ˜ ๊ฒฐ์ •์—๋Š” ์–ด๋ ค์›€์„ ๊ฒช์Šต๋‹ˆ๋‹ค.

  • ํ”„๋กฌํ”„ํŠธ: "์ด ์ฝ”๋“œ์—์„œ ๋ฒ„๊ทธ, ๋ณด์•ˆ ๋ฌธ์ œ, ์„ฑ๋Šฅ ์ด์Šˆ๋ฅผ ๊ฒ€ํ† ํ•˜์„ธ์š”." + ์ฝ”๋“œ ์Šค๋‹ˆํŽซ.
  • ๋ชจ๋ธ ์‹๋ณ„ ํ•ญ๋ชฉ: ์‚ฌ์šฉ๋˜์ง€ ์•Š์€ ๋ณ€์ˆ˜, ์ž ์žฌ์  None ์˜ค๋ฅ˜, ๋น„ํšจ์œจ์ ์ธ ๋ฃจํ”„.
  • ํ•œ๊ณ„: ๋ณต์žกํ•œ ๋„๋ฉ”์ธ ๋กœ์ง์ด๋‚˜ ์•„ํ‚คํ…์ฒ˜ ํŒจํ„ด์„ ์ดํ•ดํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.

โš ๏ธWarning: โš ๏ธ ๊ฒฝ๊ณ : ๋กœ์ปฌ ๋ชจ๋ธ์€ ๊ฐœ๋ณ„ ํ•จ์ˆ˜๋Š” ์ดํ•ดํ•˜์ง€๋งŒ ์‹œ์Šคํ…œ ์•„ํ‚คํ…์ฒ˜๋Š” ์ดํ•ดํ•˜์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค. ๋””์ž์ธ ๋ฆฌ๋ทฐ๊ฐ€ ์•„๋‹Œ ๋ฆฐํŠธ ์ˆ˜์ค€์˜ ๊ฒ€์‚ฌ์— ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

ํ…Œ์ŠคํŠธ๋ฅผ ์–ด๋–ป๊ฒŒ ์ƒ์„ฑํ•ฉ๋‹ˆ๊นŒ?

๋‹จ์œ„ ํ…Œ์ŠคํŠธ ์š”์ฒญ ํ”„๋กฌํ”„ํŠธ์™€ ํ•จ๊ป˜ ํ•จ์ˆ˜ ์ฝ”๋“œ๋ฅผ ๋ชจ๋ธ์— ์ž…๋ ฅํ•˜์‹ญ์‹œ์˜ค. ํ”„๋กฌํ”„ํŠธ์— ์—ฃ์ง€ ์ผ€์ด์Šค์™€ ์˜ค๋ฅ˜ ์กฐ๊ฑด์„ ํฌํ•จํ•˜์‹ญ์‹œ์˜ค.

python
# ํ…Œ์ŠคํŠธ ์ƒ์„ฑ์„ ์œ„ํ•œ ํ”„๋กฌํ”„ํŠธ
prompt = """
์ด ํ•จ์ˆ˜์— ๋Œ€ํ•œ ํฌ๊ด„์ ์ธ ๋‹จ์œ„ ํ…Œ์ŠคํŠธ๋ฅผ ์ž‘์„ฑํ•˜์„ธ์š”:

[ํ•จ์ˆ˜ ์ฝ”๋“œ]

๋‹ค์Œ์„ ํฌํ•จํ•˜๋Š” ํ…Œ์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•˜์„ธ์š”:
- ์ •์ƒ ์ผ€์ด์Šค
- ์—ฃ์ง€ ์ผ€์ด์Šค
- ์˜ค๋ฅ˜ ์ผ€์ด์Šค

pytest ํ˜•์‹ ์‚ฌ์šฉ:
"""

# ๋ชจ๋ธ์ด ์–ด์„œ์…˜์ด ํฌํ•จ๋œ test_* ํ•จ์ˆ˜๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค

๐Ÿ› ๏ธPractice: ๐Ÿ› ๏ธ ๋ชจ๋ฒ” ์‚ฌ๋ก€: ์ •์ƒ ์ผ€์ด์Šค, ์—ฃ์ง€ ์ผ€์ด์Šค, ์˜ค๋ฅ˜ ์ผ€์ด์Šค๋ฅผ ํฌํ•จํ•˜๋Š” ํ…Œ์ŠคํŠธ๋ฅผ ์š”์ฒญํ•˜์‹ญ์‹œ์˜ค. ์˜ˆ์‹œ: "์ •์ƒ ์ผ€์ด์Šค 3๊ฐœ, ์—ฃ์ง€ ์ผ€์ด์Šค 3๊ฐœ, ์˜ค๋ฅ˜ ์ผ€์ด์Šค 2๊ฐœ๋ฅผ ํฌํ•จํ•˜๋Š” pytest ํ…Œ์ŠคํŠธ๋ฅผ ์ž‘์„ฑํ•˜์„ธ์š”."

IDE ์—ฐ๋™์„ ์–ด๋–ป๊ฒŒ ์„ค์ •ํ•ฉ๋‹ˆ๊นŒ?

VS Code์™€ Continue.dev๋ฅผ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ๊ธฐ๋ณธ ๋กœ์ปฌ LLM ์ง€์›์ด ๋‚ด์žฅ๋œ Cursor ์—๋””ํ„ฐ๋กœ ์ „ํ™˜ํ•˜์‹ญ์‹œ์˜ค. ๋‘ ๋ฐฉ๋ฒ• ๋ชจ๋‘ ํ‚ค๋ณด๋“œ ๋‹จ์ถ•ํ‚ค๋กœ ์ธ๋ผ์ธ ์ฝ”๋“œ ์ œ์•ˆ์„ ํŠธ๋ฆฌ๊ฑฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.**

  • VS Code + Continue.dev: ํ™•์žฅ ํ”„๋กœ๊ทธ๋žจ ์„ค์น˜ ํ›„ ๋กœ์ปฌ Ollama ์„œ๋ฒ„(http://localhost:11434)๋ฅผ ์—ฐ๊ฒฐํ•˜์‹ญ์‹œ์˜ค.
  • Cursor ์—๋””ํ„ฐ: Ollama ๊ธฐ๋ณธ ์ง€์›. ์ถ”๊ฐ€ ์„ค์ • ๋ถˆํ•„์š”.
  • ์ธ๋ผ์ธ ์™„์„ฑ: Ctrl+Shift+\\ (VS Code) ๋˜๋Š” Cmd+Shift+\\ (Mac)์œผ๋กœ ๋กœ์ปฌ LLM ์ œ์•ˆ์„ ํŠธ๋ฆฌ๊ฑฐํ•ฉ๋‹ˆ๋‹ค.
IDE ์—ฐ๋™ ์„ค์ •: Ollama(ollama.ai) ์„ค์น˜ โ†’ Continue.dev VS Code ํ™•์žฅ ์„ค์น˜ โ†’ localhost:11434 ์„ค์ • โ†’ Qwen3-Coder 7B ๋ชจ๋ธ ์„ ํƒ โ†’ Ctrl+Shift+\๋กœ ์ธ๋ผ์ธ ์ œ์•ˆ ํŠธ๋ฆฌ๊ฑฐ. 3๋‹จ๊ณ„ ์„ค์ • ์™„๋ฃŒ.
IDE ์—ฐ๋™ ์„ค์ •: Ollama(ollama.ai) ์„ค์น˜ โ†’ Continue.dev VS Code ํ™•์žฅ ์„ค์น˜ โ†’ localhost:11434 ์„ค์ • โ†’ Qwen3-Coder 7B ๋ชจ๋ธ ์„ ํƒ โ†’ Ctrl+Shift+\๋กœ ์ธ๋ผ์ธ ์ œ์•ˆ ํŠธ๋ฆฌ๊ฑฐ. 3๋‹จ๊ณ„ ์„ค์ • ์™„๋ฃŒ.

๐Ÿ“ŒNote: ๐Ÿ“Œ ์ฐธ๊ณ : Continue.dev๋Š” ๋กœ์ปฌ์—์„œ Ollama๋ฅผ ์‹คํ–‰ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. VS Code ๊ธฐ๋ฐ˜์˜ Cursor ์—๋””ํ„ฐ๋Š” Ollama๋ฅผ ๊ธฐ๋ณธ ์ง€์›ํ•˜๋ฏ€๋กœ ์ถ”๊ฐ€ ์„ค์ •์ด ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

ํ”ํ•œ ์‹ค์ˆ˜๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

  • ๊ฒ€ํ†  ์—†์ด ์ƒ์„ฑ๋œ ์ฝ”๋“œ๋ฅผ ์‹ ๋ขฐํ•˜๋Š” ๊ฒƒ. ์ƒ์„ฑ๋œ ์ฝ”๋“œ์—๋Š” ๋ฒ„๊ทธ๊ฐ€ ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํ•ญ์ƒ ๊ฒ€ํ† ํ•˜์‹ญ์‹œ์˜ค.
  • ๋„ˆ๋ฌด ์ž‘์€ ๋ชจ๋ธ ์‚ฌ์šฉ. Qwen3-Coder 7B๊ฐ€ ์‹ค์šฉ์ ์ธ ์ฝ”๋”ฉ์˜ ์ตœ์†Œ ์š”๊ตฌ ์‚ฌํ•ญ์ž…๋‹ˆ๋‹ค. 3B ๋ชจ๋ธ์€ ์ €ํ’ˆ์งˆ ์ฝ”๋“œ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.
  • ์ปจํ…์ŠคํŠธ๋ฅผ ์ œ๊ณตํ•˜์ง€ ์•Š๋Š” ๊ฒƒ. ์ฝ”๋“œ ํ’ˆ์งˆ์€ ํ”„๋กฌํ”„ํŠธ ์ปจํ…์ŠคํŠธ์— ๋‹ฌ๋ ค ์žˆ์Šต๋‹ˆ๋‹ค. ํ•จ์ˆ˜ ์‹œ๊ทธ๋‹ˆ์ฒ˜, ํƒ€์ž…, docstring์„ ์ œ๊ณตํ•˜์‹ญ์‹œ์˜ค.
  • ์•„ํ‚คํ…์ฒ˜๋ฅผ ์ดํ•ดํ•  ๊ฒƒ์œผ๋กœ ๊ธฐ๋Œ€ํ•˜๋Š” ๊ฒƒ. ๋กœ์ปฌ ๋ชจ๋ธ์€ ๊ฐœ๋ณ„ ํ•จ์ˆ˜๋ฅผ ์ดํ•ดํ•˜์ง€๋งŒ ์‹œ์Šคํ…œ ์„ค๊ณ„๋Š” ์ดํ•ดํ•˜์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค.
  • ์ฝ”๋”ฉ ์ „์šฉ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์ง€ ์•Š๋Š” ๊ฒƒ. ๋ฒ”์šฉ ๋ชจ๋ธ(Llama 3.3 8B, Mistral Small)์€ ์ฝ”๋”ฉ ๋ชจ๋ธ(Qwen3-Coder 7B: 72%)๋ณด๋‹ค HumanEval์—์„œ 15~25% ๋‚ฎ์€ ์ ์ˆ˜๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค(Llama 3.3 8B: 55%). ํ•ญ์ƒ ์ฝ”๋“œ๋ฅผ ์œ„ํ•ด ํŠน๋ณ„ํžˆ ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. Ollama์—์„œ: `ollama pull qwen2.5-coder:7b` โ€” ์ฝ”๋”ฉ ์ž‘์—…์—๋Š” `ollama pull llama3.1:8b`๊ฐ€ ์•„๋‹™๋‹ˆ๋‹ค.
ํ”ํ•œ ์ฝ”๋”ฉ ์‹ค์ˆ˜ ๋Œ€ ๋ชจ๋ฒ” ์‚ฌ๋ก€: 3B ๋ชจ๋ธ ํšŒํ”ผ(๋‚ฎ์€ ์ •ํ™•๋„), ์ตœ์†Œ Qwen3-Coder 7B ์‚ฌ์šฉ(72% HumanEval). ๋ฐ˜๋ณต ํšŸ์ˆ˜ ์ œํ•œ(10~20), ํ•ญ์ƒ ์ฝ”๋“œ ๊ฒ€ํ† , ๋ฒ”์šฉ Mistral ๋˜๋Š” Llama๊ฐ€ ์•„๋‹Œ ์ฝ”๋”ฉ ์ „์šฉ ๋ชจ๋ธ ์‚ฌ์šฉ.
ํ”ํ•œ ์ฝ”๋”ฉ ์‹ค์ˆ˜ ๋Œ€ ๋ชจ๋ฒ” ์‚ฌ๋ก€: 3B ๋ชจ๋ธ ํšŒํ”ผ(๋‚ฎ์€ ์ •ํ™•๋„), ์ตœ์†Œ Qwen3-Coder 7B ์‚ฌ์šฉ(72% HumanEval). ๋ฐ˜๋ณต ํšŸ์ˆ˜ ์ œํ•œ(10~20), ํ•ญ์ƒ ์ฝ”๋“œ ๊ฒ€ํ† , ๋ฒ”์šฉ Mistral ๋˜๋Š” Llama๊ฐ€ ์•„๋‹Œ ์ฝ”๋”ฉ ์ „์šฉ ๋ชจ๋ธ ์‚ฌ์šฉ.

์ž์ฃผ ๋ฌป๋Š” ์งˆ๋ฌธ

2026๋…„ ์ฝ”๋”ฉ์— ๊ฐ€์žฅ ์ข‹์€ ๋กœ์ปฌ LLM์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

24 GB VRAM์—์„œ ์ตœ๊ณ  ํ’ˆ์งˆ์„ ์œ„ํ•ด Qwen3-Coder 32B(92.7% HumanEval)๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. 5 GB VRAM์—์„œ ์†๋„๋ฅผ ์›ํ•˜์‹ ๋‹ค๋ฉด Qwen3-Coder 7B(72%)๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค. Apple Silicon MacBook ์‚ฌ์šฉ์ž: Qwen3-Coder 7B๋Š” Ollama๋ฅผ ํ†ตํ•ด M1 Pro+์—์„œ 30~60 tok/sec๋กœ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.

Qwen3-Coder 32B๋Š” GitHub Copilot๊ณผ ์–ด๋–ป๊ฒŒ ๋น„๊ต๋ฉ๋‹ˆ๊นŒ?

Qwen3-Coder 32B๋Š” HumanEval์—์„œ 92.7%๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค โ€” Copilot์˜ GPT-5.2 ๋ฐฑ์—”๋“œ(~94%)์™€ 2% ์ด๋‚ด์˜ ์ฐจ์ด์ž…๋‹ˆ๋‹ค. ์†๋„: ๋กœ์ปฌ์€ ์ œ์•ˆ๋‹น 2~5์ดˆ ๋Œ€ Copilot์˜ ~300ms(ํด๋ผ์šฐ๋“œ ์ด์ ). ํ’ˆ์งˆ์€ ๊ฑฐ์˜ ๋™๋“ฑํ•ฉ๋‹ˆ๋‹ค. ํ”„๋ผ์ด๋ฒ„์‹œ: ๋กœ์ปฌ์€ ์ฝ”๋“œ๋ฅผ ์˜จ๋””๋ฐ”์ด์Šค์— ๋ณด๊ด€ํ•ฉ๋‹ˆ๋‹ค. ๋น„์šฉ: ๋กœ์ปฌ์€ ํ•˜๋“œ์›จ์–ด ํ›„ ์›” $0; Copilot์€ ์›” $19($228/๋…„).

VS Code์—์„œ ๋กœ์ปฌ ์ฝ”๋”ฉ LLM์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค โ€” Continue.dev ํ™•์žฅ ํ”„๋กœ๊ทธ๋žจ(๋ฌด๋ฃŒ, ์˜คํ”ˆ ์†Œ์Šค)์„ ์„ค์น˜ํ•˜์‹ญ์‹œ์˜ค. localhost:11434์˜ Ollama์— ์—ฐ๊ฒฐํ•˜๋„๋ก ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค. Tab ๋˜๋Š” Ctrl+Shift+\\๋กœ ์ธ๋ผ์ธ ์™„์„ฑ์ด ํŠธ๋ฆฌ๊ฑฐ๋ฉ๋‹ˆ๋‹ค. Continue.dev๋Š” Qwen3-Coder, DeepSeek-Coder ๋ฐ ๋ชจ๋“  Ollama ๋ชจ๋ธ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.

๋…์  ์ฝ”๋“œ๋ฒ ์ด์Šค์—๋Š” Copilot๊ณผ ๋กœ์ปฌ LLM ์ค‘ ์–ด๋А ๊ฒƒ์ด ๋‚ซ์Šต๋‹ˆ๊นŒ?

๋กœ์ปฌ LLM์ด ๋‚ซ์Šต๋‹ˆ๋‹ค. Copilot์„ ์‚ฌ์šฉํ•˜๋ฉด ์ฝ”๋“œ๊ฐ€ Microsoft/OpenAI ์„œ๋ฒ„๋กœ ์ „์†ก๋ฉ๋‹ˆ๋‹ค. Ollama์˜ ๋กœ์ปฌ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๋ฉด ์ฝ”๋“œ๊ฐ€ ์ ˆ๋Œ€ ์™ธ๋ถ€๋กœ ๋‚˜๊ฐ€์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ทœ์ œ ์‚ฐ์—…(๊ธˆ์œต, ์˜๋ฃŒ, ๊ตญ๋ฐฉ)์˜ ๊ฒฝ์šฐ ๋กœ์ปฌ์ด ์œ ์ผํ•œ ๊ทœ์ • ์ค€์ˆ˜ ์˜ต์…˜์ž…๋‹ˆ๋‹ค. HumanEval์˜ ํ’ˆ์งˆ ์ฐจ์ด๋Š” ~2%๋กœ ๋ฏธ๋ฏธํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ ์ฝ”๋”ฉ LLM์—๋Š” VRAM์ด ์–ผ๋งˆ๋‚˜ ํ•„์š”ํ•ฉ๋‹ˆ๊นŒ?

์ตœ์†Œ: Qwen3-Coder 7B Q4๋ฅผ ์œ„ํ•ด 5 GB VRAM. ๊ถŒ์žฅ: 7B ์ถ”๋ก ์„ ์œ„ํ•ด 8 GB. ํ”„๋ฆฌ๋ฏธ์—„: ์ตœ๊ณ  ํ’ˆ์งˆ์˜ Qwen3-Coder 32B๋ฅผ ์œ„ํ•ด 24 GB. RTX 4060 Ti(8 GB)๋Š” 7B ๋ชจ๋ธ์„ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. RTX 4070(12 GB)์€ 14~16B ๋ชจ๋ธ์„ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค. RTX 4090/5090(24~32 GB)์€ 32B ๋ชจ๋ธ์„ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ ์ฝ”๋”ฉ LLM์€ Copilot์ฒ˜๋Ÿผ ์ž๋™ ์™„์„ฑ์„ ์ง€์›ํ•ฉ๋‹ˆ๊นŒ?

์ง€์›ํ•ฉ๋‹ˆ๋‹ค โ€” Continue.dev ๋˜๋Š” Cursor ์—๋””ํ„ฐ๋ฅผ ํ†ตํ•ด ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‘ ๋ฐฉ๋ฒ• ๋ชจ๋‘ ๋ชจ๋ธ์ด ์ปค์„œ ์œ„์•„๋ž˜์˜ ์ฝ”๋“œ๋ฅผ ๋ณด๊ณ  ์ค‘๊ฐ„์„ ์ƒ์„ฑํ•˜๋Š” fill-in-the-middle(FIM) ๋ชจ๋“œ๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. Qwen3-Coder 7B๋Š” FIM์„ ๊ธฐ๋ณธ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ์‘๋‹ต ์‹œ๊ฐ„: GPU์—์„œ 1~3์ดˆ(Copilot์˜ 200~300ms ํด๋ผ์šฐ๋“œ ๋Œ€๋น„).

๋‚ด ์ฝ”๋“œ๋ฒ ์ด์Šค์— ๋งž๊ฒŒ ์ฝ”๋”ฉ ๋ชจ๋ธ์„ ํŒŒ์ธํŠœ๋‹ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค โ€” Unsloth๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ LoRA/QLoRA๋กœ ํŒŒ์ธํŠœ๋‹ํ•˜์‹ญ์‹œ์˜ค. ์ธ์ŠคํŠธ๋Ÿญ์…˜ ํ˜•์‹์œผ๋กœ ์ฝ”๋“œ๋ฒ ์ด์Šค์—์„œ 500๊ฐœ ์ด์ƒ์˜ ์ฝ”๋“œ ์˜ˆ์‹œ๋ฅผ ์ค€๋น„ํ•˜์‹ญ์‹œ์˜ค(์ž…๋ ฅ: ํ•จ์ˆ˜ ์‹œ๊ทธ๋‹ˆ์ฒ˜ + docstring, ์ถœ๋ ฅ: ๊ตฌํ˜„). 8 GB VRAM์—์„œ Qwen3-Coder 7B ํŒŒ์ธํŠœ๋‹์€ 1~2์‹œ๊ฐ„์ด ์†Œ์š”๋ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์ธ ์ •ํ™•๋„ ํ–ฅ์ƒ: ํŠน์ • ์ฝ”๋“œ ํŒจํ„ด์—์„œ 10~15%.

๊ฐ€์žฅ ๋งŽ์€ ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด๋ฅผ ์ง€์›ํ•˜๋Š” ์ฝ”๋”ฉ LLM์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Qwen3-Coder 32B์™€ DeepSeek-Coder-V2 ๋ชจ๋‘ Python, JavaScript, TypeScript, Rust, Go, Java, C++, SQL, Bash, Ruby๋ฅผ ํฌํ•จํ•œ 90๊ฐœ ์ด์ƒ์˜ ์–ธ์–ด๋ฅผ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. CodeLlama๋Š” Python๊ณผ C++์—์„œ ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•ฉ๋‹ˆ๋‹ค. ํ‹ˆ์ƒˆ ์–ธ์–ด(Haskell, Erlang, Elixir)์˜ ๊ฒฝ์šฐ Qwen3-Coder 32B๊ฐ€ ๊ฐ€์žฅ ๋„“์€ ์ง€์› ๋ฒ”์œ„๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์ถœ์ฒ˜

  • HumanEval ๋ฒค์น˜๋งˆํฌ โ€” OpenAI์˜ ๊ณต์‹ ์ฝ”๋“œ ์ƒ์„ฑ ๋ฒค์น˜๋งˆํฌ
  • Qwen3-Coder ๋ชจ๋ธ ์นด๋“œ โ€” Qwen3-Coder ๋ชจ๋ธ ์‚ฌ์–‘ ๋ฐ ํ‰๊ฐ€ ๊ฒฐ๊ณผ
  • Continue.dev IDE ํ™•์žฅ โ€” ๋กœ์ปฌ ๋ฐ ํด๋ผ์šฐ๋“œ LLM์„ ์œ„ํ•œ ์˜คํ”ˆ ์†Œ์Šค IDE ์ง€์›
  • ๋กœ์ปฌ LLM์€ ์ฝ”๋“œ ์ƒ์„ฑ์— ํƒ์›”ํ•˜์ง€๋งŒ ์ฝ”๋“œ ํ’ˆ์งˆ์€ ํ”„๋กฌํ”„ํŠธ ํ’ˆ์งˆ์— ๋‹ฌ๋ ค ์žˆ์Šต๋‹ˆ๋‹ค. ์ฝ”๋”ฉ ํŠนํ™” ํ”„๋กฌํ”„ํŠธ ๊ธฐ๋ฒ•์„ ํ•™์Šตํ•˜์„ธ์š”: AI๋กœ ๋” ๋‚˜์€ ์ฝ”๋“œ ์ž‘์„ฑํ•˜๊ธฐ์—์„œ ํ…Œ์ŠคํŠธ, ๋ฆฌ๋ทฐ, ๋ฐ˜๋ณต์— ๋Œ€ํ•ด ๋‹ค๋ฃน๋‹ˆ๋‹ค.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Run PromptQuorum with a local LLM, your own API keys, or both โ€” you pick the backend.

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

๋กœ์ปฌ LLM ์ฝ”๋”ฉ 2026: Qwen3-Coder 92% HumanEval | PromptQuorum