Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/๋กœ์ปฌ LLM ์ฒ˜์Œ ์‹คํ–‰ํ•˜๊ธฐ: ์„ค์น˜๋ถ€ํ„ฐ ์ฒซ ์‘๋‹ต๊นŒ์ง€ 10๋ถ„ ์™„์„ฑ
Getting Started

๋กœ์ปฌ LLM ์ฒ˜์Œ ์‹คํ–‰ํ•˜๊ธฐ: ์„ค์น˜๋ถ€ํ„ฐ ์ฒซ ์‘๋‹ต๊นŒ์ง€ 10๋ถ„ ์™„์„ฑ

ยท7๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

Ollama๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋กœ์ปฌ LLM์„ 10๋ถ„ ์ด๋‚ด์— ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Ollama๋ฅผ ์„ค์น˜ํ•˜๊ณ  ๋ช…๋ น์–ด ํ•˜๋‚˜๋กœ ๋ชจ๋ธ์„ ๋‹ค์šด๋กœ๋“œํ•œ ํ›„, ํ„ฐ๋ฏธ๋„์—์„œ ๋ฐ”๋กœ ๋Œ€ํ™”๋ฅผ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค. API ํ‚ค, ๊ณ„์ •, ์ตœ์ดˆ ๋‹ค์šด๋กœ๋“œ ์ดํ›„์˜ ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ์ด ์ „ํ˜€ ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

Ollama๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋กœ์ปฌ LLM์„ 10๋ถ„ ์ด๋‚ด์— ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Ollama๋ฅผ ์„ค์น˜ํ•˜๊ณ  ๋ช…๋ น์–ด ํ•˜๋‚˜๋กœ ๋ชจ๋ธ์„ ๋‹ค์šด๋กœ๋“œํ•œ ํ›„, ํ„ฐ๋ฏธ๋„์—์„œ ๋ฐ”๋กœ ๋Œ€ํ™”๋ฅผ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค. API ํ‚ค, ๊ณ„์ •, ์ตœ์ดˆ ๋‹ค์šด๋กœ๋“œ ์ดํ›„์˜ ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ์ด ์ „ํ˜€ ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. 2026๋…„ 4์›” ๊ธฐ์ค€, ์ดˆ๋ณด์ž์—๊ฒŒ ๊ฐ€์žฅ ๋น ๋ฅธ ๋ชจ๋ธ์€ ์ตœ์‹  ๋…ธํŠธ๋ถ CPU์—์„œ ์ดˆ๋‹น 25~45 ํ† ํฐ์„ ์ฒ˜๋ฆฌํ•˜๋Š” Llama 3.2 3B์ž…๋‹ˆ๋‹ค.

4-Step Local LLM PipelineA horizontal flow diagram showing the four steps to run a local LLM: Install Ollama, Pull a Model, Run the Model, and Start Chatting.1. Installollama.com2. Pullllama3.2:3b3. Runollama run4. ChatLocal AI2 min2-5 min<1 secInstant

Position: intro

Key Takeaways

  • ๊ฐ€์žฅ ๋น ๋ฅธ ๋ฐฉ๋ฒ•: Ollama ์„ค์น˜ โ†’ `ollama run llama3.2` ์‹คํ–‰ โ†’ ํ„ฐ๋ฏธ๋„์—์„œ ๋Œ€ํ™” ์‹œ์ž‘. ๋น ๋ฅธ ์ธํ„ฐ๋„ท ํ™˜๊ฒฝ์—์„œ ์ด ์†Œ์š” ์‹œ๊ฐ„์€ 5๋ถ„ ์ด๋‚ด์ž…๋‹ˆ๋‹ค.
  • RAM 8 GB ๊ธฐ๊ธฐ: `llama3.2:3b` (๋‹ค์šด๋กœ๋“œ 2 GB) ๋˜๋Š” `phi4-mini` (2.3 GB)๋กœ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค. ๋‘ ๋ชจ๋ธ ๋ชจ๋‘ ์ตœ์‹  ๋…ธํŠธ๋ถ์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค.
  • CPU์—์„œ ์ดˆ๋‹น 15~40 ํ† ํฐ, ์ค‘๊ธ‰ GPU ๋˜๋Š” Apple Silicon์—์„œ ์ดˆ๋‹น 60~120 ํ† ํฐ์„ ๊ธฐ๋Œ€ํ•˜์‹ญ์‹œ์˜ค.
  • ์ฒซ ์‘๋‹ต์€ ํด๋ผ์šฐ๋“œ API๋ณด๋‹ค ๋А๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋กœ์ปฌ ๋ชจ๋ธ์€ ์†๋„ ๋Œ€์‹  ํ”„๋ผ์ด๋ฒ„์‹œ์™€ ๋ฌด๋ฃŒ ์ด์šฉ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  • ์ตœ์ดˆ ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ ์ดํ›„์—๋Š” ๋ชจ๋“  ์ฒ˜๋ฆฌ๊ฐ€ ์˜คํ”„๋ผ์ธ์œผ๋กœ ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. ์ดํ›„ ์„ธ์…˜์—์„œ๋Š” ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ์ด ํ•„์š” ์—†์Šต๋‹ˆ๋‹ค.

1๋‹จ๊ณ„: Ollama ์„ค์น˜

Ollama๋Š” ๋กœ์ปฌ LLM์„ ๊ฐ€์žฅ ๋น ๋ฅด๊ฒŒ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ๋„๊ตฌ์ž…๋‹ˆ๋‹ค. ๋ช…๋ น์–ด ํ•˜๋‚˜ ๋˜๋Š” 2๋ถ„ ์ด๋‚ด์˜ ๋‹ค์šด๋กœ๋“œ๋กœ ์„ค์น˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค:

bash
# macOS (Homebrew)
brew install ollama

# Linux
curl -fsSL https://ollama.com/install.sh | sh

# Windows: ollama.com/download์—์„œ ์„ค์น˜ ํŒŒ์ผ์„ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค

Ollama ์‹คํ–‰ ํ™•์ธ

์„ค์น˜ ํ›„ Ollama๊ฐ€ ์ •์ƒ์ ์œผ๋กœ ์‹คํ–‰ ์ค‘์ธ์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค:

bash
curl http://localhost:11434
# ์˜ˆ์ƒ ์ถœ๋ ฅ: Ollama is running

2๋‹จ๊ณ„: ์ฒซ ๋ชจ๋ธ ์„ ํƒ

์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ RAM์— ๋”ฐ๋ผ ๋ชจ๋ธ์„ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. ์–ด๋–ค ๋ชจ๋ธ์„ ์„ ํƒํ•ด์•ผ ํ• ์ง€ ๋ชจ๋ฅด๊ฒ ๋‹ค๋ฉด `llama3.2:3b`๋กœ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค. RAM 4 GB ์ด์ƒ์˜ ๋ชจ๋“  ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰๋˜๋ฉฐ ์œ ์šฉํ•œ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค:

๋ณด์œ  RAM๊ถŒ์žฅ ๋ชจ๋ธ๋‹ค์šด๋กœ๋“œ ํฌ๊ธฐ์ด์œ 
4 GBllama3.2:1b์•ฝ 1.3 GB๊ฐ€์žฅ ์ž‘์€ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•œ Llama ๋ชจ๋ธ
8 GBLlama 3.2 3B์•ฝ 2 GB์ดˆ๋ณด์ž๋ฅผ ์œ„ํ•œ ์ตœ์ ์˜ ํ’ˆ์งˆ/ํฌ๊ธฐ ๋น„์œจ
8~16 GBLlama 3.3 8B์•ฝ 4.7 GB๊ฐ•๋ ฅํ•œ ๋ฒ”์šฉ ๋ชจ๋ธ
16 GB ์ด์ƒmistral:7b ๋˜๋Š” qwen2.5:7b์•ฝ 4~5 GB์šฐ์ˆ˜ํ•œ ํ’ˆ์งˆ, ๋น ๋ฅธ ์ถ”๋ก  ์†๋„

3๋‹จ๊ณ„: ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ

`ollama pull` ๋ช…๋ น์–ด๋กœ ๋ชจ๋ธ์„ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค. ๋ชจ๋ธ์€ `~/.ollama/models`์— ์ €์žฅ๋˜๋ฉฐ ํ•œ ๋ฒˆ๋งŒ ๋‹ค์šด๋กœ๋“œํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค:

bash
ollama pull llama3.2

# ๋˜๋Š” ํŠน์ • ํฌ๊ธฐ ๋ณ€ํ˜•์„ ๋‹ค์šด๋กœ๋“œ
ollama pull llama3.2:3b
ollama pull llama3.1:8b

๋‹ค์šด๋กœ๋“œ ์ง„ํ–‰ ํ™”๋ฉด

Ollama๋Š” ํ„ฐ๋ฏธ๋„์—์„œ ๋‹ค์šด๋กœ๋“œ ์ง„ํ–‰ ์ƒํ™ฉ์„ ํ‘œ์‹œํ•ฉ๋‹ˆ๋‹ค. `llama3.2:3b` ๋ชจ๋ธ์€ ์ผ๋ฐ˜์ ์ธ ๊ด‘๋Œ€์—ญ ์ธํ„ฐ๋„ท ํ™˜๊ฒฝ์—์„œ 2~5๋ถ„์ด ์†Œ์š”๋ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์€ ์••์ถ•๋œ ํ˜•ํƒœ๋กœ ์ €์žฅ๋˜๋ฏ€๋กœ 2 GB ๋‹ค์šด๋กœ๋“œ๊ฐ€ ๋””์Šคํฌ์—์„œ ์•ฝ 2.3 GB๋กœ ๋Š˜์–ด๋‚ฉ๋‹ˆ๋‹ค.

text
pulling manifest
pulling 966de95ca8dc... 100% โ–•โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ– 1.9 GB
pulling 9f436a92eb8b... 100% โ–•โ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–ˆโ–   42 B
verifying sha256 digest
writing manifest
success

4๋‹จ๊ณ„: ๋ชจ๋ธ ์‹คํ–‰ ๋ฐ ์ฒซ ํ”„๋กฌํ”„ํŠธ ์ „์†ก

๋Œ€ํ™”ํ˜• ์ฑ„ํŒ… ์„ธ์…˜์„ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค:

bash
ollama run llama3.2

# Ollama๊ฐ€ ๋ชจ๋ธ์„ ๋กœ๋“œํ•˜๊ณ  ํ”„๋กฌํ”„ํŠธ๋ฅผ ํ‘œ์‹œํ•ฉ๋‹ˆ๋‹ค:
>>> Send a message (/? for help)

์ฒซ ๋ฒˆ์งธ ๋Œ€ํ™”

๋ฉ”์‹œ์ง€๋ฅผ ์ž…๋ ฅํ•˜๊ณ  Enter ํ‚ค๋ฅผ ๋ˆ„๋ฅด์‹ญ์‹œ์˜ค. ๋ชจ๋ธ์ด ํ† ํฐ ๋‹จ์œ„๋กœ ์‘๋‹ต์„ ์ŠคํŠธ๋ฆฌ๋ฐํ•ฉ๋‹ˆ๋‹ค:

text
>>> What are local LLMs?

Local LLMs (large language models) are AI models that run entirely
on your own hardware -- your laptop, desktop, or server. Unlike cloud
services such as ChatGPT or Claude, local LLMs process everything
locally with no data sent to external servers...

์†๋„, ํ’ˆ์งˆ ๋ฐ ํ•œ๊ณ„ ๊ธฐ๋Œ€์น˜

์†๋„๋Š” ํ•˜๋“œ์›จ์–ด์— ๋”ฐ๋ผ ๋‹ค๋ฆ…๋‹ˆ๋‹ค. 2023๋…„ํ˜• ๋…ธํŠธ๋ถ(GPU ์—†์Œ): 3B ๋ชจ๋ธ์—์„œ ์ดˆ๋‹น 15~25 ํ† ํฐ, 8B ๋ชจ๋ธ์—์„œ ์ดˆ๋‹น 8~15 ํ† ํฐ์„ ๊ธฐ๋Œ€ํ•˜์‹ญ์‹œ์˜ค. Apple M3 Pro: 8B ๋ชจ๋ธ์—์„œ ์ดˆ๋‹น 50~80 ํ† ํฐ. NVIDIA RTX 4070 Ti: 8B ๋ชจ๋ธ์—์„œ ์ดˆ๋‹น 90~130 ํ† ํฐ.

`llama3.2:3b`์˜ ํ’ˆ์งˆ์€ ๋ณต์žกํ•œ ์ž‘์—…์—์„œ GPT-5.5๋‚˜ Claude Opus 4.8๋ณด๋‹ค ๋ˆˆ์— ๋„๊ฒŒ ๋‚ฎ์Šต๋‹ˆ๋‹ค. ์š”์•ฝ, ๊ฐ„๋‹จํ•œ Q&A, ์ฝ”๋“œ ์„ค๋ช…์—์„œ๋Š” ์ถฉ๋ถ„ํžˆ ์œ ์šฉํ•œ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋‹จ๊ณ„ ์ถ”๋ก ์ด๋‚˜ ์žฅ๋ฌธ ์ž‘์„ฑ์—๋Š” 8B ๋˜๋Š” 13B ๋ชจ๋ธ๋กœ ์—…๊ทธ๋ ˆ์ด๋“œํ•˜์‹ญ์‹œ์˜ค.

์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ: `llama3.2:3b`๋Š” Ollama์—์„œ ๊ธฐ๋ณธ์ ์œผ๋กœ 128K ํ† ํฐ์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค. ์‹ค์ œ๋กœ๋Š” ๋‹จ์ผ ๋Œ€ํ™”์—์„œ ์•ฝ 16K ํ† ํฐ์„ ๋„˜์–ด์„œ๋ฉด ํ’ˆ์งˆ์ด ์ €ํ•˜๋ฉ๋‹ˆ๋‹ค.

์ฒซ ์‘๋‹ต ์ง€์—ฐ: `ollama run` ์ดํ›„ ์ฒซ ๋ฒˆ์งธ ์‘๋‹ต์—๋Š” ๋ชจ๋ธ ๋กœ๋”ฉ ์‹œ๊ฐ„(5~30์ดˆ)์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ๊ฐ™์€ ์„ธ์…˜ ๋‚ด ์ดํ›„ ์‘๋‹ต์€ ๋” ๋น ๋ฆ…๋‹ˆ๋‹ค.

ํ„ฐ๋ฏธ๋„ ์ดํ›„ ๋กœ์ปฌ LLM ํ™œ์šฉ ๋ฐฉ๋ฒ•

Ollama ํ„ฐ๋ฏธ๋„ ์ฑ„ํŒ…์€ ํ…Œ์ŠคํŠธ์— ์œ ์šฉํ•˜์ง€๋งŒ, ์‹ค์ œ ํ™œ์šฉ ์‚ฌ๋ก€ ๋Œ€๋ถ€๋ถ„์—๋Š” ๋” ๋‚˜์€ ์ธํ„ฐํŽ˜์ด์Šค๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค:

  • Open WebUI: Ollama๋ฅผ ์œ„ํ•œ ์™„์ „ํ•œ ๊ธฐ๋Šฅ์˜ ์›น UI์ž…๋‹ˆ๋‹ค. Docker๋กœ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค: `docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway ghcr.io/open-webui/open-webui:main`. http://localhost:3000์—์„œ ์ ‘์†ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • LM Studio: ๋ฐ์Šคํฌํƒ‘ GUI๋ฅผ ์„ ํ˜ธํ•˜์‹ ๋‹ค๋ฉด LM Studio ์„ค์น˜ ๋ฐฉ๋ฒ•์—์„œ ์ „์ฒด ์„ค์ • ๊ณผ์ •์„ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. LM Studio์˜ ๋‚ด์žฅ ์ฑ„ํŒ… ์ธํ„ฐํŽ˜์ด์Šค๋Š” ์„ธ๋ จ๋˜๊ณ  ๋Œ€ํ™” ๊ธฐ๋ก์„ ์ง€์›ํ•ฉ๋‹ˆ๋‹ค.
  • API ์—ฐ๋™: `localhost:11434`์˜ Ollama API๋Š” OpenAI SDK์™€ ํ˜ธํ™˜๋ฉ๋‹ˆ๋‹ค. OpenAI base URL์„ ์ˆ˜์šฉํ•˜๋Š” ๋ชจ๋“  ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์„ ๋กœ์ปฌ ๋ชจ๋ธ์— ์—ฐ๊ฒฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • VS Code / Cursor: Continue.dev ๊ฐ™์€ ํ™•์žฅ ํ”„๋กœ๊ทธ๋žจ์ด Ollama์— ์—ฐ๊ฒฐ๋˜์–ด ํŽธ์ง‘๊ธฐ ๋‚ด์—์„œ ์ง์ ‘ ๋กœ์ปฌ AI ์ฝ”๋”ฉ ์ง€์›์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM ์ฒซ ์‹คํ–‰: ์ง€์—ญ๋ณ„ ์ฐธ๊ณ ์‚ฌํ•ญ

EU / GDPR: Ollama๋กœ ๋กœ์ปฌ LLM์„ ์‹คํ–‰ํ•˜๋ฉด ํ”„๋กฌํ”„ํŠธ ๋ฐ์ดํ„ฐ, ์ปจํ…์ŠคํŠธ, ์ถœ๋ ฅ์ด ๊ธฐ๊ธฐ ๋ฐ–์œผ๋กœ ๋‚˜๊ฐ€์ง€ ์•Š์Šต๋‹ˆ๋‹ค. GDPR ์ œ46์กฐ์˜ ์ด์ „ ๋ฉ”์ปค๋‹ˆ์ฆ˜์ด ์ ์šฉ๋˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ฐœ์ธ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃจ๋Š” EU ์ „๋ฌธ๊ฐ€์—๊ฒŒ ์ด๋Š” ํด๋ผ์šฐ๋“œ AI API์˜ ํ”„๋ผ์ด๋ฒ„์‹œ ๋ณดํ˜ธ ๋Œ€์•ˆ์ž…๋‹ˆ๋‹ค. ์ฒซ ๋ฒˆ์งธ ๋กœ์ปฌ ๋ชจ๋ธ(llama3.2:3b)์€ ๋””์Šคํฌ 2 GB๋ฅผ ์‚ฌ์šฉํ•˜๊ณ  ์™ธ๋ถ€ API ํ˜ธ์ถœ์„ ์ „ํ˜€ ์ƒ์„ฑํ•˜์ง€ ์•Š์œผ๋ฉฐ, ๋…์ผ BSI์˜ ๋ฐ์ดํ„ฐ ์ตœ์†Œํ™” ์ง€์นจ์„ ์„ค๊ณ„ ๋‹จ๊ณ„์—์„œ๋ถ€ํ„ฐ ์ถฉ์กฑํ•ฉ๋‹ˆ๋‹ค.

์ผ๋ณธ(METI): METI AI ๊ฑฐ๋ฒ„๋„Œ์Šค ๊ฐ€์ด๋“œ๋ผ์ธ์€ AI ์ถ”๋ก ์ด ์–ด๋””์—์„œ ๋ฐœ์ƒํ•˜๋Š”์ง€ ๋ฌธ์„œํ™”ํ•˜๋„๋ก ์š”๊ตฌํ•ฉ๋‹ˆ๋‹ค. Ollama ์„ค์ •์€ ์™„์ „ํ•˜๊ณ  ๊ฐ์‚ฌ ๊ฐ€๋Šฅํ•œ ๋กœ์ปฌ ํ™˜๊ฒฝ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ ํŒŒ์ผ์€ ๋ฒ„์ „๋ณ„ ํŒŒ์ผ๋ช…์œผ๋กœ ~/.ollama/models์— ์ €์žฅ๋˜๊ณ , ์™ธ๋ถ€ API ์˜์กด์„ฑ์ด ์—†์œผ๋ฉฐ, `ollama ps`๋กœ ์ถ”๋ก ์„ ๊ฒ€์ฆํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. Llama ๋˜๋Š” Qwen3๋ฅผ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๋Š” ์ผ๋ณธ ์ „๋ฌธ๊ฐ€๋Š” METI ์ปดํ”Œ๋ผ์ด์–ธ์Šค ๋ชฉ์ ์œผ๋กœ ์ •ํ™•ํ•œ ๋ชจ๋ธ ๋ฒ„์ „๊ณผ ํ•˜๋“œ์›จ์–ด๋ฅผ ๋ฌธ์„œํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•œ๊ตญ: ํ•œ๊ตญ์–ด ์›Œํฌํ”Œ๋กœ์šฐ์—์„œ๋Š” ์ฒซ ๋ฒˆ์งธ ๋ชจ๋ธ๋กœ llama3.2:3b ๋Œ€์‹  qwen2.5:3b๋ฅผ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค: `ollama pull qwen2.5:3b`. Qwen3๋Š” ๋™์ผํ•œ ํ•˜๋“œ์›จ์–ด ํ™˜๊ฒฝ์—์„œ Llama๋ณด๋‹ค ํ•œ๊ตญ์–ด ํ…์ŠคํŠธ๋ฅผ 30~40% ๋” ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜์—ฌ ๋” ๋‚˜์€ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ollama pull ๋ฐ run ๋ช…๋ น์–ด๋Š” ๋™์ผํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM ์ฒ˜์Œ ์‹คํ–‰ ์‹œ ์ž์ฃผ ๋ฌป๋Š” ์งˆ๋ฌธ

๋ชจ๋ธ ์‘๋‹ต์ด ๋งค์šฐ ๋А๋ฆฝ๋‹ˆ๋‹ค. ์ •์ƒ์ธ๊ฐ€์š”?

CPU ์ „์šฉ ํ•˜๋“œ์›จ์–ด์—์„œ 7B ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ ์ดˆ๋‹น 8~20 ํ† ํฐ์€ ์ •์ƒ์ž…๋‹ˆ๋‹ค. ๊ฐ ํ† ํฐ์€ ์•ฝ 0.75๊ฐœ์˜ ๋‹จ์–ด์— ํ•ด๋‹นํ•ฉ๋‹ˆ๋‹ค. ์ดˆ๋‹น 10 ํ† ํฐ์ด๋ผ๋ฉด 100๋‹จ์–ด ์‘๋‹ต์— ์•ฝ 13์ดˆ๊ฐ€ ๊ฑธ๋ฆฝ๋‹ˆ๋‹ค. ์ถ”๋ก  ์†๋„๋ฅผ ๋†’์ด๋ ค๋ฉด ๋” ์ž‘์€ ๋ชจ๋ธ(8B ๋Œ€์‹  3B)์„ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜, ํ˜ธํ™˜ GPU๊ฐ€ ์žˆ๋‹ค๋ฉด GPU ์˜คํ”„๋กœ๋”ฉ์„ ํ™œ์„ฑํ™”ํ•˜๊ฑฐ๋‚˜, ๊ฐ€์žฅ ๋น ๋ฅธ ์ผ๋ฐ˜ ์„ค์ •์ธ Q4_K_M ์–‘์žํ™” ์ˆ˜์ค€์„ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

๋‘ ๋ชจ๋ธ์„ ๋™์‹œ์— ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

RAM์ด ์ถฉ๋ถ„ํ•˜๋‹ค๋ฉด Ollama๋Š” ์—ฌ๋Ÿฌ ๋ชจ๋ธ์„ ๋™์‹œ์— ๋กœ๋“œ๋œ ์ƒํƒœ๋กœ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ๋ณธ์ ์œผ๋กœ Ollama๋Š” 5๋ถ„ ๋น„ํ™œ์„ฑ ํ›„ ๋ชจ๋ธ์„ ์–ธ๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค. OLLAMA_KEEP_ALIVE ํ™˜๊ฒฝ ๋ณ€์ˆ˜๋กœ ์ด๋ฅผ ๋ณ€๊ฒฝํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‘ ๊ฐœ์˜ 7B ๋ชจ๋ธ์„ ๋™์‹œ์— ์‹คํ–‰ํ•˜๋ ค๋ฉด ์•ฝ 16 GB์˜ RAM์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

Ollama๊ฐ€ ๋ฐฑ๊ทธ๋ผ์šด๋“œ์—์„œ ์‹คํ–‰๋˜๋Š” ๊ฒƒ์„ ์ค‘์ง€ํ•˜๋ ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•˜๋‚˜์š”?

macOS: ๋ฉ”๋‰ด ๋ฐ”์˜ llama ์•„์ด์ฝ˜์„ ํด๋ฆญํ•˜๊ณ  Quit์„ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. Linux: `systemctl stop ollama`๋ฅผ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. Windows: ์‹œ์Šคํ…œ ํŠธ๋ ˆ์ด ์•„์ด์ฝ˜์„ ์˜ค๋ฅธ์ชฝ ํด๋ฆญํ•˜๊ณ  Quit์„ ์„ ํƒํ•˜์‹ญ์‹œ์˜ค. ๋กœ๊ทธ์ธ ์‹œ Ollama๊ฐ€ ์‹œ์ž‘๋˜์ง€ ์•Š๋„๋ก ํ•˜๋ ค๋ฉด ์‹œ์ž‘ ํ•ญ๋ชฉ์—์„œ ์ œ๊ฑฐํ•˜์‹ญ์‹œ์˜ค.

๋กœ์ปฌ LLM์„ ์ฒ˜์Œ ์‹คํ–‰ํ•˜๋Š” ๊ฐ€์žฅ ์‰ฌ์šด ๋ฐฉ๋ฒ•์€ ๋ฌด์—‡์ธ๊ฐ€์š”?

Ollama(ollama.com)๋ฅผ ์„ค์น˜ํ•˜๊ณ , `ollama pull llama3.2:3b`๋ฅผ ์‹คํ–‰ํ•œ ๋‹ค์Œ, `ollama run llama3.2:3b`๋ฅผ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. ์ด๊ฒƒ์ด ์ „๋ถ€์ž…๋‹ˆ๋‹ค. ์„ธ ๊ฐœ์˜ ๋ช…๋ น์–ด, 2~5๋ถ„์ด๋ฉด ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ ์—†์ด๋„ ๊ธฐ๊ธฐ์—์„œ ์ž‘๋™ํ•˜๋Š” AI ๋ชจ๋ธ์„ ๊ฐ–๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM์ด ์ •์ƒ์ ์œผ๋กœ ์ž‘๋™ํ•˜๋Š”์ง€ ์–ด๋–ป๊ฒŒ ์•Œ ์ˆ˜ ์žˆ๋‚˜์š”?

ํ„ฐ๋ฏธ๋„์—์„œ `ollama ps`๋ฅผ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. ๋ชจ๋ธ์ด ์‹คํ–‰ ์ค‘์ด๋ผ๋ฉด ์ด๋ฆ„, ํฌ๊ธฐ, ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰๊ณผ ํ•จ๊ป˜ ๋ชฉ๋ก์— ํ‘œ์‹œ๋ฉ๋‹ˆ๋‹ค. "2+2๋Š” ์–ผ๋งˆ์ธ๊ฐ€์š”?"์™€ ๊ฐ™์€ ๊ฐ„๋‹จํ•œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ๋ณด๋‚ด์‹ญ์‹œ์˜ค. "4"๋ผ๊ณ  ์‘๋‹ตํ•˜๋ฉด ๋ชจ๋ธ์ด ์ •์ƒ์ ์œผ๋กœ ์ž‘๋™ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM์„ ์‹คํ–‰ํ•˜๋ ค๋ฉด GPU๊ฐ€ ํ•„์š”ํ•œ๊ฐ€์š”?

์•„๋‹™๋‹ˆ๋‹ค. ๋กœ์ปฌ LLM์€ CPU์—์„œ๋„ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. GPU๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ์ถ”๋ก  ์†๋„๊ฐ€ 5~10๋ฐฐ ๋นจ๋ผ์ง€์ง€๋งŒ, CPU ์ „์šฉ์œผ๋กœ๋„ ํ•™์Šต ๋ฐ ๋งŽ์€ ์‹ค์ œ ์‚ฌ์šฉ ์‚ฌ๋ก€์— ์ถฉ๋ถ„ํ•ฉ๋‹ˆ๋‹ค. Apple M1/M2, AMD Ryzen, ๋˜๋Š” Intel 12์„ธ๋Œ€ CPU๊ฐ€ ํƒ‘์žฌ๋œ ์ตœ์‹  ๋…ธํŠธ๋ถ์€ 3B~7B ๋ชจ๋ธ์„ ํ•ฉ๋ฆฌ์ ์ธ ์†๋„(์ดˆ๋‹น 10~30 ํ† ํฐ)๋กœ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM์€ ๋””์Šคํฌ ๊ณต๊ฐ„์„ ์–ผ๋งˆ๋‚˜ ์ฐจ์ง€ํ•˜๋‚˜์š”?

`llama3.2:1b`๋Š” 1.3 GB, `llama3.2:3b`๋Š” 2 GB, `llama3.1:8b`๋Š” 4.7 GB์ž…๋‹ˆ๋‹ค. ์ด๋Š” Ollama๊ฐ€ ์ €์žฅํ•˜๋Š” ์••์ถ• ํฌ๊ธฐ์ž…๋‹ˆ๋‹ค. ์ถ”๋ก ์„ ์œ„ํ•ด RAM์— ๋กœ๋“œ๋  ๋•Œ ํฌ๊ธฐ๊ฐ€ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค(์ž์„ธํ•œ ๋‚ด์šฉ์€ ๋กœ์ปฌ LLM์— ํ•„์š”ํ•œ VRAM ์ฐธ์กฐ).

์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ ์—†์ด ๋กœ์ปฌ LLM์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‚˜์š”?

๋„ค, ์™„์ „ํžˆ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. Ollama๋กœ ๋ชจ๋ธ์„ ํ•œ ๋ฒˆ ๋‹ค์šด๋กœ๋“œ(์ธํ„ฐ๋„ท ํ•„์š”)ํ•˜๋ฉด ์ดํ›„์—๋Š” ์ธํ„ฐ๋„ท ์—†์ด ์˜๊ตฌ์ ์œผ๋กœ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์„ค ๋„คํŠธ์›Œํฌ, ๋น„ํ–‰๊ธฐ, ๋˜๋Š” ์™„์ „ํ•œ ์˜คํ”„๋ผ์ธ ํ™˜๊ฒฝ์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ LLM์€ ChatGPT์™€ ์–ด๋–ป๊ฒŒ ๋‹ค๋ฅธ๊ฐ€์š”?

ChatGPT๋Š” Anthropic์˜ ์„œ๋ฒ„์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ LLM์€ ์‚ฌ์šฉ์ž์˜ ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ = ๋ฐ์ดํ„ฐ๊ฐ€ ๊ธฐ๊ธฐ ๋ฐ–์œผ๋กœ ๋‚˜๊ฐ€์ง€ ์•Š์Œ, ์™„์ „ํ•œ ํ”„๋ผ์ด๋ฒ„์‹œ, ์ง€์†์ ์ธ API ๋น„์šฉ ์—†์Œ. ChatGPT = ๋ณต์žกํ•œ ์ž‘์—…์—์„œ ๋” ๋†’์€ ํ’ˆ์งˆ, ์ธํ„ฐ๋„ท ๋ฐ ์œ ๋ฃŒ ๊ตฌ๋… ํ•„์š”. ๋‘ ๋ฐฉ์‹ ๋ชจ๋‘ ์žฅ๋‹จ์ ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

Ollama๋กœ ์ฒ˜์Œ ์‹œ๋„ํ•ด๋ณผ ์ตœ์ ์˜ ๋ชจ๋ธ์€ ๋ฌด์—‡์ธ๊ฐ€์š”?

`ollama pull llama3.2:3b` โ€” ์šฉ๋Ÿ‰์ด 2 GB์ด๊ณ  ์ตœ์‹  ๋…ธํŠธ๋ถ์—์„œ ์‹คํ–‰๋˜๋ฉฐ ์ ์ ˆํ•œ ๋‹ต๋ณ€์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. Ollama๊ฐ€ ๊ถŒ์žฅํ•˜๋Š” ์‹œ์ž‘์ ์ž…๋‹ˆ๋‹ค. ์‚ฌ์šฉํ•ด๋ณธ ํ›„ ํ•˜๋“œ์›จ์–ด์— ๋งž๋Š” ๋Œ€์•ˆ์„ ํ™•์ธํ•˜๋ ค๋ฉด ์ดˆ๋ณด์ž๋ฅผ ์œ„ํ•œ ์ตœ์  ๋กœ์ปฌ LLM ๋ชจ๋ธ์„ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

์ฒซ ์‹คํ–‰ ์ดํ›„ ๋‹ค์Œ ๋‹จ๊ณ„

๋กœ์ปฌ LLM์ด ์ •์ƒ์ ์œผ๋กœ ์ž‘๋™ํ•˜๊ณ  ์žˆ๋‹ค๋ฉด ์ด์ œ ๋‹ค์–‘ํ•œ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ํƒ์ƒ‰ํ•ด ๋ณด์‹ญ์‹œ์˜ค. ํ•˜๋“œ์›จ์–ด์— ๊ฐ€์žฅ ์ ํ•ฉํ•œ ๋ชจ๋ธ์„ ํŒŒ์•…ํ•˜๋ ค๋ฉด ์ดˆ๋ณด์ž๋ฅผ ์œ„ํ•œ ์ตœ์  ๋กœ์ปฌ LLM ๋ชจ๋ธ์„ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค. ๋…ธํŠธ๋ถ ํŠนํ™” ์„ฑ๋Šฅ ํŒ์€ ๋…ธํŠธ๋ถ์—์„œ ๋กœ์ปฌ LLM ์‹คํ–‰ํ•˜๊ธฐ๋ฅผ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ํ”„๋ผ์ด๋ฒ„์‹œ ๋ฐ ๋ณด์•ˆ ๋ชจ๋ฒ” ์‚ฌ๋ก€๋Š” ๋กœ์ปฌ LLM ๋ณด์•ˆ ๋ฐ ํ”„๋ผ์ด๋ฒ„์‹œ ์ฒดํฌ๋ฆฌ์ŠคํŠธ๋ฅผ ์ฐธ์กฐํ•˜์‹ญ์‹œ์˜ค.

์ถœ์ฒ˜

์ฒซ ์‹คํ–‰ ํ›„ ์ž์ฃผ ํ•˜๋Š” ์‹ค์ˆ˜

  • ํ† ํฐ ์ˆ˜์™€ ์†๋„๋ฅผ ํ˜ผ๋™ํ•˜๋Š” ๊ฒƒ โ€” ์ดˆ๋‹น 20 ํ† ํฐ์œผ๋กœ 100 ํ† ํฐ์„ ์ƒ์„ฑํ•˜๋Š” 7B ๋ชจ๋ธ์€ 5์ดˆ๊ฐ€ ๊ฑธ๋ฆฌ๋ฉฐ ์ฆ‰๊ฐ์ ์ด์ง€ ์•Š์Šต๋‹ˆ๋‹ค.
  • ๋‹ค๋ฅธ ์ž‘์—…์œผ๋กœ ์‹œ์Šคํ…œ์ด ๋ฐ”์œ ์ƒํƒœ์—์„œ ์ถ”๋ก ์„ ์‹คํ–‰ํ•˜๋ฉด ์‹ค์ œ ํ† ํฐ/์ดˆ๊ฐ€ ํฌ๊ฒŒ ๊ฐ์†Œํ•ฉ๋‹ˆ๋‹ค.
  • ์ปจํ…์ŠคํŠธ ์œˆ๋„์šฐ ํ•œ๊ณ„๋ฅผ ํ™•์ธํ•˜์ง€ ์•Š๋Š” ๊ฒƒ โ€” ๋Œ€๋ถ€๋ถ„์˜ ์ž…๋ฌธ ๋ชจ๋ธ์€ 2K~8K ํ† ํฐ์„ ์ง€์›ํ•˜๋ฉฐ ํ”„๋ก ํ‹ฐ์–ด ๋ชจ๋ธ์˜ 100K+์™€๋Š” ๋‹ค๋ฆ…๋‹ˆ๋‹ค.
  • ์ฒซ ์‹คํ–‰ ์‹œ ์ฆ‰๊ฐ์ ์ธ ์‘๋‹ต์„ ๊ธฐ๋Œ€ํ•˜๋Š” ๊ฒƒ โ€” ์ฒซ ๋ฒˆ์งธ ์‘๋‹ต์—๋Š” ๋ชจ๋ธ ๋กœ๋”ฉ ์‹œ๊ฐ„(5~30์ดˆ)์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค. ๊ฐ™์€ ์„ธ์…˜ ๋‚ด ์ดํ›„ ์‘๋‹ต์€ 2~5๋ฐฐ ๋น ๋ฆ…๋‹ˆ๋‹ค.
  • ์ž˜๋ชป๋œ ๋ชจ๋ธ ํƒœ๊ทธ ์‚ฌ์šฉ โ€” `llama3.1:8b-text`๋Š” ๊ธฐ๋ณธ ํ…์ŠคํŠธ ์™„์„ฑ ๋ชจ๋“œ๋กœ ๋ฌดํ•œ ๋ฐ˜๋ณต๋ฉ๋‹ˆ๋‹ค. ์ฑ„ํŒ…์—๋Š” `llama3.1:8b-instruct`์™€ ๊ฐ™์€ `-instruct` ํƒœ๊ทธ๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Run PromptQuorum with a local LLM, your own API keys, or both โ€” you pick the backend.

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

๋กœ์ปฌ LLM ์ฒ˜์Œ ์‹คํ–‰ํ•˜๊ธฐ 10๋ถ„ ์™„์„ฑ (๋‹จ๊ณ„๋ณ„ ์•ˆ๋‚ด) | PromptQuorum