Key Takeaways
- ๊ฐ์ฅ ๋น ๋ฅธ ๋ฐฉ๋ฒ: Ollama ์ค์น โ `ollama run llama3.2` ์คํ โ ํฐ๋ฏธ๋์์ ๋ํ ์์. ๋น ๋ฅธ ์ธํฐ๋ท ํ๊ฒฝ์์ ์ด ์์ ์๊ฐ์ 5๋ถ ์ด๋ด์ ๋๋ค.
- RAM 8 GB ๊ธฐ๊ธฐ: `llama3.2:3b` (๋ค์ด๋ก๋ 2 GB) ๋๋ `phi4-mini` (2.3 GB)๋ก ์์ํ์ญ์์ค. ๋ ๋ชจ๋ธ ๋ชจ๋ ์ต์ ๋ ธํธ๋ถ์์ ์คํ๋ฉ๋๋ค.
- CPU์์ ์ด๋น 15~40 ํ ํฐ, ์ค๊ธ GPU ๋๋ Apple Silicon์์ ์ด๋น 60~120 ํ ํฐ์ ๊ธฐ๋ํ์ญ์์ค.
- ์ฒซ ์๋ต์ ํด๋ผ์ฐ๋ API๋ณด๋ค ๋๋ฆด ์ ์์ต๋๋ค. ๋ก์ปฌ ๋ชจ๋ธ์ ์๋ ๋์ ํ๋ผ์ด๋ฒ์์ ๋ฌด๋ฃ ์ด์ฉ์ ์ ๊ณตํฉ๋๋ค.
- ์ต์ด ๋ชจ๋ธ ๋ค์ด๋ก๋ ์ดํ์๋ ๋ชจ๋ ์ฒ๋ฆฌ๊ฐ ์คํ๋ผ์ธ์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค. ์ดํ ์ธ์ ์์๋ ์ธํฐ๋ท ์ฐ๊ฒฐ์ด ํ์ ์์ต๋๋ค.
1๋จ๊ณ: Ollama ์ค์น
Ollama๋ ๋ก์ปฌ LLM์ ๊ฐ์ฅ ๋น ๋ฅด๊ฒ ์คํํ ์ ์๋ ๋๊ตฌ์ ๋๋ค. ๋ช ๋ น์ด ํ๋ ๋๋ 2๋ถ ์ด๋ด์ ๋ค์ด๋ก๋๋ก ์ค์นํ ์ ์์ต๋๋ค:
# macOS (Homebrew)
brew install ollama
# Linux
curl -fsSL https://ollama.com/install.sh | sh
# Windows: ollama.com/download์์ ์ค์น ํ์ผ์ ๋ค์ด๋ก๋ํ์ญ์์คOllama ์คํ ํ์ธ
์ค์น ํ Ollama๊ฐ ์ ์์ ์ผ๋ก ์คํ ์ค์ธ์ง ํ์ธํ์ญ์์ค:
curl http://localhost:11434
# ์์ ์ถ๋ ฅ: Ollama is running2๋จ๊ณ: ์ฒซ ๋ชจ๋ธ ์ ํ
์ฌ์ฉ ๊ฐ๋ฅํ RAM์ ๋ฐ๋ผ ๋ชจ๋ธ์ ์ ํํ์ญ์์ค. ์ด๋ค ๋ชจ๋ธ์ ์ ํํด์ผ ํ ์ง ๋ชจ๋ฅด๊ฒ ๋ค๋ฉด `llama3.2:3b`๋ก ์์ํ์ญ์์ค. RAM 4 GB ์ด์์ ๋ชจ๋ ๊ธฐ๊ธฐ์์ ์คํ๋๋ฉฐ ์ ์ฉํ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํฉ๋๋ค:
| ๋ณด์ RAM | ๊ถ์ฅ ๋ชจ๋ธ | ๋ค์ด๋ก๋ ํฌ๊ธฐ | ์ด์ |
|---|---|---|---|
| 4 GB | llama3.2:1b | ์ฝ 1.3 GB | ๊ฐ์ฅ ์์ ์ฌ์ฉ ๊ฐ๋ฅํ Llama ๋ชจ๋ธ |
| 8 GB | Llama 3.2 3B | ์ฝ 2 GB | ์ด๋ณด์๋ฅผ ์ํ ์ต์ ์ ํ์ง/ํฌ๊ธฐ ๋น์จ |
| 8~16 GB | Llama 3.3 8B | ์ฝ 4.7 GB | ๊ฐ๋ ฅํ ๋ฒ์ฉ ๋ชจ๋ธ |
| 16 GB ์ด์ | mistral:7b ๋๋ qwen2.5:7b | ์ฝ 4~5 GB | ์ฐ์ํ ํ์ง, ๋น ๋ฅธ ์ถ๋ก ์๋ |
3๋จ๊ณ: ๋ชจ๋ธ ๋ค์ด๋ก๋
`ollama pull` ๋ช ๋ น์ด๋ก ๋ชจ๋ธ์ ๋ค์ด๋ก๋ํ์ญ์์ค. ๋ชจ๋ธ์ `~/.ollama/models`์ ์ ์ฅ๋๋ฉฐ ํ ๋ฒ๋ง ๋ค์ด๋ก๋ํ๋ฉด ๋ฉ๋๋ค:
ollama pull llama3.2
# ๋๋ ํน์ ํฌ๊ธฐ ๋ณํ์ ๋ค์ด๋ก๋
ollama pull llama3.2:3b
ollama pull llama3.1:8b๋ค์ด๋ก๋ ์งํ ํ๋ฉด
Ollama๋ ํฐ๋ฏธ๋์์ ๋ค์ด๋ก๋ ์งํ ์ํฉ์ ํ์ํฉ๋๋ค. `llama3.2:3b` ๋ชจ๋ธ์ ์ผ๋ฐ์ ์ธ ๊ด๋์ญ ์ธํฐ๋ท ํ๊ฒฝ์์ 2~5๋ถ์ด ์์๋ฉ๋๋ค. ๋ชจ๋ธ์ ์์ถ๋ ํํ๋ก ์ ์ฅ๋๋ฏ๋ก 2 GB ๋ค์ด๋ก๋๊ฐ ๋์คํฌ์์ ์ฝ 2.3 GB๋ก ๋์ด๋ฉ๋๋ค.
pulling manifest
pulling 966de95ca8dc... 100% โโโโโโโโโโโโโโโโโโ 1.9 GB
pulling 9f436a92eb8b... 100% โโโโโโโโโโโโโโโโโโ 42 B
verifying sha256 digest
writing manifest
success4๋จ๊ณ: ๋ชจ๋ธ ์คํ ๋ฐ ์ฒซ ํ๋กฌํํธ ์ ์ก
๋ํํ ์ฑํ ์ธ์ ์ ์์ํ์ญ์์ค:
ollama run llama3.2
# Ollama๊ฐ ๋ชจ๋ธ์ ๋ก๋ํ๊ณ ํ๋กฌํํธ๋ฅผ ํ์ํฉ๋๋ค:
>>> Send a message (/? for help)์ฒซ ๋ฒ์งธ ๋ํ
๋ฉ์์ง๋ฅผ ์ ๋ ฅํ๊ณ Enter ํค๋ฅผ ๋๋ฅด์ญ์์ค. ๋ชจ๋ธ์ด ํ ํฐ ๋จ์๋ก ์๋ต์ ์คํธ๋ฆฌ๋ฐํฉ๋๋ค:
>>> What are local LLMs?
Local LLMs (large language models) are AI models that run entirely
on your own hardware -- your laptop, desktop, or server. Unlike cloud
services such as ChatGPT or Claude, local LLMs process everything
locally with no data sent to external servers...์๋, ํ์ง ๋ฐ ํ๊ณ ๊ธฐ๋์น
์๋๋ ํ๋์จ์ด์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค. 2023๋ ํ ๋ ธํธ๋ถ(GPU ์์): 3B ๋ชจ๋ธ์์ ์ด๋น 15~25 ํ ํฐ, 8B ๋ชจ๋ธ์์ ์ด๋น 8~15 ํ ํฐ์ ๊ธฐ๋ํ์ญ์์ค. Apple M3 Pro: 8B ๋ชจ๋ธ์์ ์ด๋น 50~80 ํ ํฐ. NVIDIA RTX 4070 Ti: 8B ๋ชจ๋ธ์์ ์ด๋น 90~130 ํ ํฐ.
`llama3.2:3b`์ ํ์ง์ ๋ณต์กํ ์์ ์์ GPT-5.5๋ Claude Opus 4.8๋ณด๋ค ๋์ ๋๊ฒ ๋ฎ์ต๋๋ค. ์์ฝ, ๊ฐ๋จํ Q&A, ์ฝ๋ ์ค๋ช ์์๋ ์ถฉ๋ถํ ์ ์ฉํ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํฉ๋๋ค. ๋ค๋จ๊ณ ์ถ๋ก ์ด๋ ์ฅ๋ฌธ ์์ฑ์๋ 8B ๋๋ 13B ๋ชจ๋ธ๋ก ์ ๊ทธ๋ ์ด๋ํ์ญ์์ค.
์ปจํ ์คํธ ์๋์ฐ: `llama3.2:3b`๋ Ollama์์ ๊ธฐ๋ณธ์ ์ผ๋ก 128K ํ ํฐ์ ์ง์ํฉ๋๋ค. ์ค์ ๋ก๋ ๋จ์ผ ๋ํ์์ ์ฝ 16K ํ ํฐ์ ๋์ด์๋ฉด ํ์ง์ด ์ ํ๋ฉ๋๋ค.
์ฒซ ์๋ต ์ง์ฐ: `ollama run` ์ดํ ์ฒซ ๋ฒ์งธ ์๋ต์๋ ๋ชจ๋ธ ๋ก๋ฉ ์๊ฐ(5~30์ด)์ด ํฌํจ๋ฉ๋๋ค. ๊ฐ์ ์ธ์ ๋ด ์ดํ ์๋ต์ ๋ ๋น ๋ฆ ๋๋ค.
ํฐ๋ฏธ๋ ์ดํ ๋ก์ปฌ LLM ํ์ฉ ๋ฐฉ๋ฒ
Ollama ํฐ๋ฏธ๋ ์ฑํ ์ ํ ์คํธ์ ์ ์ฉํ์ง๋ง, ์ค์ ํ์ฉ ์ฌ๋ก ๋๋ถ๋ถ์๋ ๋ ๋์ ์ธํฐํ์ด์ค๊ฐ ํ์ํฉ๋๋ค:
- Open WebUI: Ollama๋ฅผ ์ํ ์์ ํ ๊ธฐ๋ฅ์ ์น UI์ ๋๋ค. Docker๋ก ์คํํ์ญ์์ค: `docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway ghcr.io/open-webui/open-webui:main`. http://localhost:3000์์ ์ ์ํ ์ ์์ต๋๋ค.
- LM Studio: ๋ฐ์คํฌํ GUI๋ฅผ ์ ํธํ์ ๋ค๋ฉด LM Studio ์ค์น ๋ฐฉ๋ฒ์์ ์ ์ฒด ์ค์ ๊ณผ์ ์ ํ์ธํ์ญ์์ค. LM Studio์ ๋ด์ฅ ์ฑํ ์ธํฐํ์ด์ค๋ ์ธ๋ จ๋๊ณ ๋ํ ๊ธฐ๋ก์ ์ง์ํฉ๋๋ค.
- API ์ฐ๋: `localhost:11434`์ Ollama API๋ OpenAI SDK์ ํธํ๋ฉ๋๋ค. OpenAI base URL์ ์์ฉํ๋ ๋ชจ๋ ์ ํ๋ฆฌ์ผ์ด์ ์ ๋ก์ปฌ ๋ชจ๋ธ์ ์ฐ๊ฒฐํ ์ ์์ต๋๋ค.
- VS Code / Cursor: Continue.dev ๊ฐ์ ํ์ฅ ํ๋ก๊ทธ๋จ์ด Ollama์ ์ฐ๊ฒฐ๋์ด ํธ์ง๊ธฐ ๋ด์์ ์ง์ ๋ก์ปฌ AI ์ฝ๋ฉ ์ง์์ ์ ๊ณตํฉ๋๋ค.
๋ก์ปฌ LLM ์ฒซ ์คํ: ์ง์ญ๋ณ ์ฐธ๊ณ ์ฌํญ
EU / GDPR: Ollama๋ก ๋ก์ปฌ LLM์ ์คํํ๋ฉด ํ๋กฌํํธ ๋ฐ์ดํฐ, ์ปจํ ์คํธ, ์ถ๋ ฅ์ด ๊ธฐ๊ธฐ ๋ฐ์ผ๋ก ๋๊ฐ์ง ์์ต๋๋ค. GDPR ์ 46์กฐ์ ์ด์ ๋ฉ์ปค๋์ฆ์ด ์ ์ฉ๋์ง ์์ต๋๋ค. ๊ฐ์ธ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๋ EU ์ ๋ฌธ๊ฐ์๊ฒ ์ด๋ ํด๋ผ์ฐ๋ AI API์ ํ๋ผ์ด๋ฒ์ ๋ณดํธ ๋์์ ๋๋ค. ์ฒซ ๋ฒ์งธ ๋ก์ปฌ ๋ชจ๋ธ(llama3.2:3b)์ ๋์คํฌ 2 GB๋ฅผ ์ฌ์ฉํ๊ณ ์ธ๋ถ API ํธ์ถ์ ์ ํ ์์ฑํ์ง ์์ผ๋ฉฐ, ๋ ์ผ BSI์ ๋ฐ์ดํฐ ์ต์ํ ์ง์นจ์ ์ค๊ณ ๋จ๊ณ์์๋ถํฐ ์ถฉ์กฑํฉ๋๋ค.
์ผ๋ณธ(METI): METI AI ๊ฑฐ๋ฒ๋์ค ๊ฐ์ด๋๋ผ์ธ์ AI ์ถ๋ก ์ด ์ด๋์์ ๋ฐ์ํ๋์ง ๋ฌธ์ํํ๋๋ก ์๊ตฌํฉ๋๋ค. Ollama ์ค์ ์ ์์ ํ๊ณ ๊ฐ์ฌ ๊ฐ๋ฅํ ๋ก์ปฌ ํ๊ฒฝ์ ์ ๊ณตํฉ๋๋ค. ๋ชจ๋ธ ํ์ผ์ ๋ฒ์ ๋ณ ํ์ผ๋ช ์ผ๋ก ~/.ollama/models์ ์ ์ฅ๋๊ณ , ์ธ๋ถ API ์์กด์ฑ์ด ์์ผ๋ฉฐ, `ollama ps`๋ก ์ถ๋ก ์ ๊ฒ์ฆํ ์ ์์ต๋๋ค. Llama ๋๋ Qwen3๋ฅผ ๋ก์ปฌ์์ ์คํํ๋ ์ผ๋ณธ ์ ๋ฌธ๊ฐ๋ METI ์ปดํ๋ผ์ด์ธ์ค ๋ชฉ์ ์ผ๋ก ์ ํํ ๋ชจ๋ธ ๋ฒ์ ๊ณผ ํ๋์จ์ด๋ฅผ ๋ฌธ์ํํ ์ ์์ต๋๋ค.
ํ๊ตญ: ํ๊ตญ์ด ์ํฌํ๋ก์ฐ์์๋ ์ฒซ ๋ฒ์งธ ๋ชจ๋ธ๋ก llama3.2:3b ๋์ qwen2.5:3b๋ฅผ ์ ํํ์ญ์์ค: `ollama pull qwen2.5:3b`. Qwen3๋ ๋์ผํ ํ๋์จ์ด ํ๊ฒฝ์์ Llama๋ณด๋ค ํ๊ตญ์ด ํ ์คํธ๋ฅผ 30~40% ๋ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ์ฌ ๋ ๋์ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํฉ๋๋ค. ollama pull ๋ฐ run ๋ช ๋ น์ด๋ ๋์ผํฉ๋๋ค.
๋ก์ปฌ LLM ์ฒ์ ์คํ ์ ์์ฃผ ๋ฌป๋ ์ง๋ฌธ
๋ชจ๋ธ ์๋ต์ด ๋งค์ฐ ๋๋ฆฝ๋๋ค. ์ ์์ธ๊ฐ์?
CPU ์ ์ฉ ํ๋์จ์ด์์ 7B ๋ชจ๋ธ์ ๊ฒฝ์ฐ ์ด๋น 8~20 ํ ํฐ์ ์ ์์ ๋๋ค. ๊ฐ ํ ํฐ์ ์ฝ 0.75๊ฐ์ ๋จ์ด์ ํด๋นํฉ๋๋ค. ์ด๋น 10 ํ ํฐ์ด๋ผ๋ฉด 100๋จ์ด ์๋ต์ ์ฝ 13์ด๊ฐ ๊ฑธ๋ฆฝ๋๋ค. ์ถ๋ก ์๋๋ฅผ ๋์ด๋ ค๋ฉด ๋ ์์ ๋ชจ๋ธ(8B ๋์ 3B)์ ์ฌ์ฉํ๊ฑฐ๋, ํธํ GPU๊ฐ ์๋ค๋ฉด GPU ์คํ๋ก๋ฉ์ ํ์ฑํํ๊ฑฐ๋, ๊ฐ์ฅ ๋น ๋ฅธ ์ผ๋ฐ ์ค์ ์ธ Q4_K_M ์์ํ ์์ค์ ์ฌ์ฉํ์ญ์์ค.
๋ ๋ชจ๋ธ์ ๋์์ ์คํํ ์ ์๋์?
RAM์ด ์ถฉ๋ถํ๋ค๋ฉด Ollama๋ ์ฌ๋ฌ ๋ชจ๋ธ์ ๋์์ ๋ก๋๋ ์ํ๋ก ์ ์งํ ์ ์์ต๋๋ค. ๊ธฐ๋ณธ์ ์ผ๋ก Ollama๋ 5๋ถ ๋นํ์ฑ ํ ๋ชจ๋ธ์ ์ธ๋ก๋ํฉ๋๋ค. OLLAMA_KEEP_ALIVE ํ๊ฒฝ ๋ณ์๋ก ์ด๋ฅผ ๋ณ๊ฒฝํ ์ ์์ต๋๋ค. ๋ ๊ฐ์ 7B ๋ชจ๋ธ์ ๋์์ ์คํํ๋ ค๋ฉด ์ฝ 16 GB์ RAM์ด ํ์ํฉ๋๋ค.
Ollama๊ฐ ๋ฐฑ๊ทธ๋ผ์ด๋์์ ์คํ๋๋ ๊ฒ์ ์ค์งํ๋ ค๋ฉด ์ด๋ป๊ฒ ํ๋์?
macOS: ๋ฉ๋ด ๋ฐ์ llama ์์ด์ฝ์ ํด๋ฆญํ๊ณ Quit์ ์ ํํ์ญ์์ค. Linux: `systemctl stop ollama`๋ฅผ ์คํํ์ญ์์ค. Windows: ์์คํ ํธ๋ ์ด ์์ด์ฝ์ ์ค๋ฅธ์ชฝ ํด๋ฆญํ๊ณ Quit์ ์ ํํ์ญ์์ค. ๋ก๊ทธ์ธ ์ Ollama๊ฐ ์์๋์ง ์๋๋ก ํ๋ ค๋ฉด ์์ ํญ๋ชฉ์์ ์ ๊ฑฐํ์ญ์์ค.
๋ก์ปฌ LLM์ ์ฒ์ ์คํํ๋ ๊ฐ์ฅ ์ฌ์ด ๋ฐฉ๋ฒ์ ๋ฌด์์ธ๊ฐ์?
Ollama(ollama.com)๋ฅผ ์ค์นํ๊ณ , `ollama pull llama3.2:3b`๋ฅผ ์คํํ ๋ค์, `ollama run llama3.2:3b`๋ฅผ ์คํํ์ญ์์ค. ์ด๊ฒ์ด ์ ๋ถ์ ๋๋ค. ์ธ ๊ฐ์ ๋ช ๋ น์ด, 2~5๋ถ์ด๋ฉด ์ธํฐ๋ท ์ฐ๊ฒฐ ์์ด๋ ๊ธฐ๊ธฐ์์ ์๋ํ๋ AI ๋ชจ๋ธ์ ๊ฐ๊ฒ ๋ฉ๋๋ค.
๋ก์ปฌ LLM์ด ์ ์์ ์ผ๋ก ์๋ํ๋์ง ์ด๋ป๊ฒ ์ ์ ์๋์?
ํฐ๋ฏธ๋์์ `ollama ps`๋ฅผ ์คํํ์ญ์์ค. ๋ชจ๋ธ์ด ์คํ ์ค์ด๋ผ๋ฉด ์ด๋ฆ, ํฌ๊ธฐ, ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋๊ณผ ํจ๊ป ๋ชฉ๋ก์ ํ์๋ฉ๋๋ค. "2+2๋ ์ผ๋ง์ธ๊ฐ์?"์ ๊ฐ์ ๊ฐ๋จํ ํ๋กฌํํธ๋ฅผ ๋ณด๋ด์ญ์์ค. "4"๋ผ๊ณ ์๋ตํ๋ฉด ๋ชจ๋ธ์ด ์ ์์ ์ผ๋ก ์๋ํ๋ ๊ฒ์ ๋๋ค.
๋ก์ปฌ LLM์ ์คํํ๋ ค๋ฉด GPU๊ฐ ํ์ํ๊ฐ์?
์๋๋๋ค. ๋ก์ปฌ LLM์ CPU์์๋ ์คํ๋ฉ๋๋ค. GPU๋ฅผ ์ฌ์ฉํ๋ฉด ์ถ๋ก ์๋๊ฐ 5~10๋ฐฐ ๋นจ๋ผ์ง์ง๋ง, CPU ์ ์ฉ์ผ๋ก๋ ํ์ต ๋ฐ ๋ง์ ์ค์ ์ฌ์ฉ ์ฌ๋ก์ ์ถฉ๋ถํฉ๋๋ค. Apple M1/M2, AMD Ryzen, ๋๋ Intel 12์ธ๋ CPU๊ฐ ํ์ฌ๋ ์ต์ ๋ ธํธ๋ถ์ 3B~7B ๋ชจ๋ธ์ ํฉ๋ฆฌ์ ์ธ ์๋(์ด๋น 10~30 ํ ํฐ)๋ก ์คํํ ์ ์์ต๋๋ค.
๋ก์ปฌ LLM์ ๋์คํฌ ๊ณต๊ฐ์ ์ผ๋ง๋ ์ฐจ์งํ๋์?
`llama3.2:1b`๋ 1.3 GB, `llama3.2:3b`๋ 2 GB, `llama3.1:8b`๋ 4.7 GB์ ๋๋ค. ์ด๋ Ollama๊ฐ ์ ์ฅํ๋ ์์ถ ํฌ๊ธฐ์ ๋๋ค. ์ถ๋ก ์ ์ํด RAM์ ๋ก๋๋ ๋ ํฌ๊ธฐ๊ฐ ๋ฌ๋ผ์ง๋๋ค(์์ธํ ๋ด์ฉ์ ๋ก์ปฌ LLM์ ํ์ํ VRAM ์ฐธ์กฐ).
์ธํฐ๋ท ์ฐ๊ฒฐ ์์ด ๋ก์ปฌ LLM์ ์ฌ์ฉํ ์ ์๋์?
๋ค, ์์ ํ ๊ฐ๋ฅํฉ๋๋ค. Ollama๋ก ๋ชจ๋ธ์ ํ ๋ฒ ๋ค์ด๋ก๋(์ธํฐ๋ท ํ์)ํ๋ฉด ์ดํ์๋ ์ธํฐ๋ท ์์ด ์๊ตฌ์ ์ผ๋ก ๋ก์ปฌ์์ ์คํํ ์ ์์ต๋๋ค. ์ฌ์ค ๋คํธ์ํฌ, ๋นํ๊ธฐ, ๋๋ ์์ ํ ์คํ๋ผ์ธ ํ๊ฒฝ์ ์ ํฉํฉ๋๋ค.
๋ก์ปฌ LLM์ ChatGPT์ ์ด๋ป๊ฒ ๋ค๋ฅธ๊ฐ์?
ChatGPT๋ Anthropic์ ์๋ฒ์์ ์คํ๋ฉ๋๋ค. ๋ก์ปฌ LLM์ ์ฌ์ฉ์์ ๊ธฐ๊ธฐ์์ ์คํ๋ฉ๋๋ค. ๋ก์ปฌ = ๋ฐ์ดํฐ๊ฐ ๊ธฐ๊ธฐ ๋ฐ์ผ๋ก ๋๊ฐ์ง ์์, ์์ ํ ํ๋ผ์ด๋ฒ์, ์ง์์ ์ธ API ๋น์ฉ ์์. ChatGPT = ๋ณต์กํ ์์ ์์ ๋ ๋์ ํ์ง, ์ธํฐ๋ท ๋ฐ ์ ๋ฃ ๊ตฌ๋ ํ์. ๋ ๋ฐฉ์ ๋ชจ๋ ์ฅ๋จ์ ์ด ์์ต๋๋ค.
Ollama๋ก ์ฒ์ ์๋ํด๋ณผ ์ต์ ์ ๋ชจ๋ธ์ ๋ฌด์์ธ๊ฐ์?
`ollama pull llama3.2:3b` โ ์ฉ๋์ด 2 GB์ด๊ณ ์ต์ ๋ ธํธ๋ถ์์ ์คํ๋๋ฉฐ ์ ์ ํ ๋ต๋ณ์ ์ ๊ณตํฉ๋๋ค. Ollama๊ฐ ๊ถ์ฅํ๋ ์์์ ์ ๋๋ค. ์ฌ์ฉํด๋ณธ ํ ํ๋์จ์ด์ ๋ง๋ ๋์์ ํ์ธํ๋ ค๋ฉด ์ด๋ณด์๋ฅผ ์ํ ์ต์ ๋ก์ปฌ LLM ๋ชจ๋ธ์ ์ฐธ์กฐํ์ญ์์ค.
์ฒซ ์คํ ์ดํ ๋ค์ ๋จ๊ณ
๋ก์ปฌ LLM์ด ์ ์์ ์ผ๋ก ์๋ํ๊ณ ์๋ค๋ฉด ์ด์ ๋ค์ํ ํ์ฉ ๊ฐ๋ฅ์ฑ์ ํ์ํด ๋ณด์ญ์์ค. ํ๋์จ์ด์ ๊ฐ์ฅ ์ ํฉํ ๋ชจ๋ธ์ ํ์ ํ๋ ค๋ฉด ์ด๋ณด์๋ฅผ ์ํ ์ต์ ๋ก์ปฌ LLM ๋ชจ๋ธ์ ์ฐธ์กฐํ์ญ์์ค. ๋ ธํธ๋ถ ํนํ ์ฑ๋ฅ ํ์ ๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM ์คํํ๊ธฐ๋ฅผ ํ์ธํ์ญ์์ค. ํ๋ผ์ด๋ฒ์ ๋ฐ ๋ณด์ ๋ชจ๋ฒ ์ฌ๋ก๋ ๋ก์ปฌ LLM ๋ณด์ ๋ฐ ํ๋ผ์ด๋ฒ์ ์ฒดํฌ๋ฆฌ์คํธ๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
์ถ์ฒ
- **Ollama ๋ชจ๋ธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ** โ ๋ค์ด๋ก๋ ๊ฐ๋ฅํ ๋ชจ๋ธ ๋ฐ ์ฌ์ ๊ณต์ ๋ชฉ๋ก
- **Ollama GitHub ์ ์ฅ์** โ ์คํ์์ค ์ฝ๋, ๋ฌธ์, ์ด์ ์ถ์
- **Meta Llama 3.2 ๋ชจ๋ธ ์นด๋** โ ๊ณต์ ์ฌ์, ํ๋ จ ๋ฐ์ดํฐ, ์ฑ๋ฅ ๋ฒค์น๋งํฌ
์ฒซ ์คํ ํ ์์ฃผ ํ๋ ์ค์
- ํ ํฐ ์์ ์๋๋ฅผ ํผ๋ํ๋ ๊ฒ โ ์ด๋น 20 ํ ํฐ์ผ๋ก 100 ํ ํฐ์ ์์ฑํ๋ 7B ๋ชจ๋ธ์ 5์ด๊ฐ ๊ฑธ๋ฆฌ๋ฉฐ ์ฆ๊ฐ์ ์ด์ง ์์ต๋๋ค.
- ๋ค๋ฅธ ์์ ์ผ๋ก ์์คํ ์ด ๋ฐ์ ์ํ์์ ์ถ๋ก ์ ์คํํ๋ฉด ์ค์ ํ ํฐ/์ด๊ฐ ํฌ๊ฒ ๊ฐ์ํฉ๋๋ค.
- ์ปจํ ์คํธ ์๋์ฐ ํ๊ณ๋ฅผ ํ์ธํ์ง ์๋ ๊ฒ โ ๋๋ถ๋ถ์ ์ ๋ฌธ ๋ชจ๋ธ์ 2K~8K ํ ํฐ์ ์ง์ํ๋ฉฐ ํ๋ก ํฐ์ด ๋ชจ๋ธ์ 100K+์๋ ๋ค๋ฆ ๋๋ค.
- ์ฒซ ์คํ ์ ์ฆ๊ฐ์ ์ธ ์๋ต์ ๊ธฐ๋ํ๋ ๊ฒ โ ์ฒซ ๋ฒ์งธ ์๋ต์๋ ๋ชจ๋ธ ๋ก๋ฉ ์๊ฐ(5~30์ด)์ด ํฌํจ๋ฉ๋๋ค. ๊ฐ์ ์ธ์ ๋ด ์ดํ ์๋ต์ 2~5๋ฐฐ ๋น ๋ฆ ๋๋ค.
- ์๋ชป๋ ๋ชจ๋ธ ํ๊ทธ ์ฌ์ฉ โ `llama3.1:8b-text`๋ ๊ธฐ๋ณธ ํ ์คํธ ์์ฑ ๋ชจ๋๋ก ๋ฌดํ ๋ฐ๋ณต๋ฉ๋๋ค. ์ฑํ ์๋ `llama3.1:8b-instruct`์ ๊ฐ์ `-instruct` ํ๊ทธ๋ฅผ ์ฌ์ฉํ์ญ์์ค.