Key Takeaways
- Q4_K_M ์์ํ ๋ฐฉ์์ 3B ๋๋ 7B ๋ชจ๋ธ์ 8GB RAM์ด ํ์ฌ๋ ์ต์ ๋ ธํธ๋ถ์์ ์ค์ฉ์ ์ผ๋ก ์ฌ์ฉํ ์ ์์ต๋๋ค.
- Apple Silicon MacBook(M1, M2, M3, M4)์ ํตํฉ ๋ฉ๋ชจ๋ฆฌ์ Metal GPU ๊ฐ์ ๋๋ถ์ ๋๋ถ๋ถ์ Windows ๋ ธํธ๋ถ๋ณด๋ค ๋ก์ปฌ ์ถ๋ก ์ฑ๋ฅ์ด ๋ฐ์ด๋ฉ๋๋ค -- M3 MacBook Pro๋ 7B ๋ชจ๋ธ์ 50~80ํ ํฐ/์ด๋ก ์คํํฉ๋๋ค.
- ์ด ์ฐ๋กํ๋ง์ ์ง์์ ์ธ ์์ฑ ์์ 10~15๋ถ ํ ์๋๋ฅผ 20~40% ๊ฐ์์ํต๋๋ค. ์์ ์ ์ธ ์๋๋ฅผ ์ ์งํ๋ ค๋ฉด ๋ ธํธ๋ถ ์คํ ๋๋ฅผ ์ฌ์ฉํ๊ณ Turbo Boost๋ฅผ ๋นํ์ฑํํ์ญ์์ค.
- ๋ฐฐํฐ๋ฆฌ ์๋ชจ: ๋๋ถ๋ถ์ ๋ ธํธ๋ถ์์ ํ์ฑ ์ถ๋ก ์ค ์๊ฐ๋น ๋ฐฐํฐ๋ฆฌ์ 30~60%๊ฐ ์๋ชจ๋ฉ๋๋ค. ์ฅ์๊ฐ ์ธ์ ์๋ ์ ์์ ์ฐ๊ฒฐํ์ญ์์ค.
- 8GB RAM Windows/Linux ๋ ธํธ๋ถ์ ๊ฒฝ์ฐ: 7B ์ดํ์ Q4_K_M ๋ชจ๋ธ์ ์ฌ์ฉํ์ญ์์ค. 16GB RAM์ ๊ฒฝ์ฐ: 13B ์ดํ์ Q4_K_M ๋ชจ๋ธ, ๋๋ 7B์๋ Q5_K_M์ ์ฌ์ฉํ์ญ์์ค.
ํ ๋ฌธ์ฅ์ผ๋ก ์์ฝ
๋ก์ปฌ LLM์ ์์ํ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ๋ ธํธ๋ถ์์ ์คํํ ์ ์์ผ๋ฉฐ, ์ฌ์ฉ ๊ฐ๋ฅํ ์ถ๋ ฅ ํ์ง์ ์ ์งํ๋ฉด์ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ ์ต๋ 75%๊น์ง ์ค์ ๋๋ค.
์ฝ๊ฒ ์ค๋ช ํ๋ฉด
LLM์ ๋ก์ปฌ์์ ์คํํ๋ ๊ฒ์ ๋ ธํธ๋ถ์ ChatGPT๋ฅผ ์ค์นํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค โ ๋ค๋ง ๋ ๋๋ฆฌ๊ณ ์์ ํ ๋น๊ณต๊ฐ์ ๋๋ค.
๋ ธํธ๋ถ์์ LLM์ ์คํํด์ผ ํ๋ ๊ฒฝ์ฐ
- โ ๋ก์ปฌ LLM์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ: ์์ ํ ๋ฐ์ดํฐ ํ๋ผ์ด๋ฒ์๊ฐ ํ์ํ ๊ฒฝ์ฐ, ์คํ๋ผ์ธ์ผ๋ก ์์ ํ๋ ๊ฒฝ์ฐ, API ๋น์ฉ์ด ์์ด์ผ ํ๋ ๊ฒฝ์ฐ
- โ ์ฌ์ฉํ์ง ๋ง์์ผ ํ๋ ๊ฒฝ์ฐ: ๋ณต์กํ ์ถ๋ก ์์ ๋์ ์ ํ๋๊ฐ ํ์ํ ๊ฒฝ์ฐ, ๊ธด ์ปจํ ์คํธ(100k+ ํ ํฐ)๊ฐ ํ์ํ ๊ฒฝ์ฐ, ๋น ๋ฅธ ๋ฐฐ์น ์ฒ๋ฆฌ๊ฐ ํ์ํ ๊ฒฝ์ฐ โ ๋ก์ปฌ LLM ํ๊ณ๋ฅผ ์ฐธ์กฐํ์ญ์์ค
๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM์ ์คํํ ์ ์์ต๋๊น?
๋ค -- ์ ์ ํ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ ํํ๋ฉด ๋ฉ๋๋ค. 8GB RAM ๋ ธํธ๋ถ์์ Q4_K_M ์์ํ์ 7B ๋ชจ๋ธ์ ์คํํ๋ฉด CPU์์ 10~25ํ ํฐ/์ด, Apple Silicon์์ 50~80ํ ํฐ/์ด๋ฅผ ๋ผ ์ ์์ต๋๋ค. ํด๋ผ์ฐ๋ API๋ณด๋ค ๋๋ฆฌ์ง๋ง ๋ํํ ์ฌ์ฉ์๋ ์ถฉ๋ถํฉ๋๋ค.
๋๋ถ๋ถ์ 8GB ๋ ธํธ๋ถ์์ ์ค์ง์ ์ธ ์ํ์ ์ 7B ๋ชจ๋ธ์ ๋๋ค. Q4_K_M์ 13B ๋ชจ๋ธ์ ์ฝ 9GB RAM์ด ํ์ํ๋ฉฐ โ ๊ธฐ์ ์ ์ผ๋ก 16GB ๊ธฐ๊ธฐ์์ ์คํ ๊ฐ๋ฅํ์ง๋ง OS์ ๋ค๋ฅธ ์ ํ๋ฆฌ์ผ์ด์ ์ ์ํ ์ฌ์ ๊ณต๊ฐ์ด ๊ฑฐ์ ์์ต๋๋ค.
ํ๋์จ์ด ๊ณ์ธต๋ณ(CPU ์ ์ฉ๋ถํฐ 16GB VRAM๊น์ง) ์์ธ ์๋ ๋ฒค์น๋งํฌ๋ **์ ์ฌ์ PC๋ฅผ ์ํ ๊ฐ์ฅ ๋น ๋ฅธ ๋ก์ปฌ LLM**์์ ํ์ธํ์ญ์์ค โ ๊ฐ ๊ณ์ธต์ ์์ํ ํธ๋ ์ด๋์คํ์ Ollama ๋ช ๋ น์ด๊ฐ ํฌํจ๋์ด ์์ต๋๋ค.
์ฌ์ฉ ์ฌ๋ก์ ๋ง๋ ๋ ธํธ๋ถ ์ค์ ์ ๋ฌด์์ ๋๊น?
- ์ด๋ณด์์ฉ โ 8GB RAM, 3B~7B ๋ชจ๋ธ, CPU๋ง ์ฌ์ฉ. 10~20ํ ํฐ/์ด๋ฅผ ์์ํ์ญ์์ค. ์ฑํ , ์์ฝ, ๊ฐ๋จํ ์ฝ๋ฉ์ ์ถฉ๋ถํฉ๋๋ค.
- ๊ฐ๋ฐ์์ฉ โ 16GB RAM, 7B~13B ๋ชจ๋ธ, ์ ํ์ GPU. ๋ค๋ฅธ ์ฑ์ ๋ซ์ง ์๊ณ ๋ ๋ฉํฐํ์คํน์ด ๊ฐ๋ฅํฉ๋๋ค.
- ๊ณ ๊ธ ์ฌ์ฉ์์ฉ โ Apple Silicon ๋๋ GPU ๋ ธํธ๋ถ (8GB VRAM), 13B ๋ชจ๋ธ. 50~90ํ ํฐ/์ด์ ์ง์์ ์ธ ์ถ๋ก .
๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM์ ์คํํ ์ ์๋ ์ฌ๋์ ๋๊ตฌ์ ๋๊น?
- ์ด๋ณด์ โ LM Studio + 3B ๋ชจ๋ธ
- ์ค๊ธ์ โ Ollama + 7B ๋ชจ๋ธ
- ๊ณ ๊ธ ์ฌ์ฉ์ โ ์์ํ ํ๋๊ณผ ํจ๊ป 13B ์ฌ์ฉ
- โ ๋ ธํธ๋ถ์ ์ฌ์ฉํ์ง ๋ง์์ผ ํ๋ ๊ฒฝ์ฐ: ์ค์๊ฐ API๊ฐ ํ์ํ ๊ฒฝ์ฐ (vLLM ์๋ฒ ์ฌ์ฉ), ๋์ฉ๋ ๋ฐ์ดํฐ์ ์ ์ฒ๋ฆฌํ๋ ๊ฒฝ์ฐ (ํด๋ผ์ฐ๋ GPU ์ฌ์ฉ)
์ด๋ค ๋ก์ปฌ LLM ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ ํ์ํฉ๋๊น?
Q4_K_M ์์ํ ์ RAM ์๊ตฌ ์ฌํญ โ ์ ์ฒด fp16 ์ ๋ฐ๋๋ณด๋ค ์ฝ 75% ์ ์ RAM. OS์ ๋ธ๋ผ์ฐ์ ๋ฅผ ์ํด ํญ์ 2~4GB ์ค๋ฒํค๋๋ฅผ ์ถ๊ฐํ์ญ์์ค:
| Model | RAM Required | Speed | Quality | Best Use |
|---|---|---|---|---|
| Llama 3.2 3B | 4~8GB | ๋น ๋ฆ (25~45ํ ํฐ/์ด) | ๋ณดํต | ๊ธฐ๋ณธ ์์ , ์ฑํ , ์์ฝ |
| Mistral Small | 8~16GB | ๋ณดํต (10~20ํ ํฐ/์ด) | ๋์ | ์ผ๋ฐ ์ฉ๋, ์ฝ๋ฉ, ์ถ๋ก |
| Llama 3.3 13B | 16GB ์ด์ | ๋๋ฆผ (5~10ํ ํฐ/์ด) | ๋ ๋์ | ๊ณ ๊ธ ์์ , ๋ณต์กํ ์ถ๋ก |
Q4_K_M ๋ฉ๋ชจ๋ฆฌ ์์: Mistral Small fp16 = 14GB; Q4_K_M = 4.5GB (~68% ์ ๊ฐ). ํ๊ท ๋ ธํธ๋ถ์ CPU ์ง์ฐ ์๊ฐ: 13B์ ๊ฒฝ์ฐ 1~3ํ ํฐ/์ด, 7B์ ๊ฒฝ์ฐ 10~25ํ ํฐ/์ด, 3B์ ๊ฒฝ์ฐ 25~45ํ ํฐ/์ด. โ VRAM ๊ณ์ฐ๊ธฐ
8GB RAM vs 16GB RAM ๋ ธํธ๋ถ: ์ค์ง์ ์ธ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
| Scenario | 8 GB RAM | 16 GB RAM |
|---|---|---|
| ์ต๋ ๋ชจ๋ธ ํฌ๊ธฐ | Q4_K_M์ 7B (~4.5GB) | Q4_K_M์ 13B (~9GB) |
| ๋ธ๋ผ์ฐ์ ์ด๋ฆฐ ์ํ์์์ ๋ชจ๋ธ | 3B~7B (์ฌ์ ์์) | 7B~13B ์ฌ์ ์๊ฒ ์คํ |
| ๊ถ์ฅ ์ฒซ ๋ฒ์งธ ๋ชจ๋ธ | llama3.2:3b ๋๋ mistral:7b | llama3.1:8b ๋๋ qwen2.5:14b |
| ๋์ ์ฑ ์คํ | 7B ๋ก๋ ์ ๋ธ๋ผ์ฐ์ ์ข ๋ฃ | ์ผ๋ฐ ๋ฉํฐํ์คํน + 7B ๋ชจ๋ธ |
๋ ธํธ๋ถ์์ ๊ฐ์ฅ ์ ์คํ๋๋ ๋ก์ปฌ LLM ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น?
์ด ๋ชจ๋ธ๋ค์ ๋ ธํธ๋ถ์ ์ ์ฝ ์กฐ๊ฑด์ ๋ง๊ฒ ํน๋ณํ ์ ์ ๋์์ต๋๋ค -- ํ์ง, RAM ์ฌ์ฉ๋, ์ง์์ ์ธ ์์ฑ ์๋์ ๊ท ํ์ ๊ณ ๋ คํ์์ต๋๋ค. ๋ค์ํ ๋ชจ๋ธ๊ณผ ๋ ธํธ๋ถ ๊ตฌ์ฑ์ ๋ํ VRAM ์๊ตฌ ์ฌํญ์ ๋ํ ์์ธํ ์๋ด๋ VRAM ์๊ตฌ ์ฌํญ ๊ฐ์ด๋ โ๋ฅผ ์ฐธ์กฐํ์ญ์์ค. Ollama๋ฅผ ์ค์นํ๋ฉด ๋จ ํ๋์ ๋ช ๋ น์ด๋ก ์ด ๋ชจ๋ธ๋ค์ ์คํํ ์ ์์ต๋๋ค:
| Model | RAM | Speed (CPU) | Quality | Best For |
|---|---|---|---|---|
| Llama 3.2 3B | 2.5GB | 25~45ํ ํฐ/์ด | ๋ณดํต | 8GB ๋ ธํธ๋ถ, ๋น ๋ฅธ ์์ |
| Phi-3.5 Mini 3.8B | 3GB | 20~35ํ ํฐ/์ด | ๋ณดํต~๋์ | 8GB ๋ ธํธ๋ถ, ์ถ๋ก /์ฝ๋ฉ |
| Mistral Small v0.3 | 4.5GB | 10~20ํ ํฐ/์ด | ๋์ | 8~16GB, ์ผ๋ฐ ์ฉ๋ |
| Qwen3 7B | 4.7GB | 10~18ํ ํฐ/์ด | ๋์ | 8~16GB, ๋ค๊ตญ์ด, ์ฝ๋ฉ |
| Llama 3.3 8B | 5.5GB | 8~15ํ ํฐ/์ด | ๋์+ | 16GB ๋ ธํธ๋ถ, ํด๋น ํฌ๊ธฐ์์ ์ต๊ณ ํ์ง |
๐ ๋ ธํธ๋ถ์ ์ํ ์ต๊ณ ์ ๋ก์ปฌ LLM ์ค์
๋ ธํธ๋ถ ํ๋์จ์ด๋ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ ํํ์ง๋ง, ํ๋กฌํํธ ์์ง๋์ด๋ง์ ์ถ๋ ฅ ํ์ง์ ํ๊ณ๋ฅผ ์์ ์ค๋๋ค. ๊ตฌ์กฐํ๋ ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ 7B ๋ชจ๋ธ์ ์๋ชป ํ๋กฌํํธ๋ 13B ๋ชจ๋ธ๋ณด๋ค ์ง์์ ์ผ๋ก ๋ ๋์ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค. ์ํ ๋ชจ๋ธ์ ์ต์ ํ๋ ๊ธฐ๋ฒ์ ํ๋กฌํํธ ์์ง๋์ด๋ง ๊ฐ์ด๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
- ๐ฅ ์ ์ฒด ์ต๊ณ : Ollama โ ๊ฐ์ฅ ๋น ๋ฅธ ์ค์ , ๊ด๋ฒ์ํ ๋ชจ๋ธ ์ง์
- ๐ฅ ์ด๋ณด์์๊ฒ ์ต๊ณ : LM Studio โ GUI ๋ฐฉ์, ํฐ๋ฏธ๋ ๋ถํ์
- ๐ฅ ์ ์ฉ๋ RAM (8GB)์ ์ต๊ณ : Llama 3.2 3B (Q4)
- โก ์ฑ๋ฅ ์ต๊ณ : Mistral Small (Q5 ๋๋ Q6)
- ๐ก ๋ชจ๋ฅด๊ฒ ๋ค๋ฉด: Ollama + Llama 3.2 3B Q4๋ก ์์ํ์ญ์์ค
Apple Silicon vs Windows ๋ ธํธ๋ถ: ๋ก์ปฌ LLM์ ์ด๋ ๊ฒ์ด ๋ ์ข์ต๋๊น?
Apple Silicon MacBook(M1~M4)์ ๋ก์ปฌ LLM ์ถ๋ก ์ ์ํ ์ต๊ณ ์ ์๋น์์ฉ ๋ ธํธ๋ถ์ ๋๋ค. ํตํฉ ๋ฉ๋ชจ๋ฆฌ ์ํคํ ์ฒ ๋๋ถ์ GPU์ CPU๊ฐ ๋์ผํ ๋ฉ๋ชจ๋ฆฌ ํ์ ๊ณต์ ํฉ๋๋ค -- 18GB ๋ฉ๋ชจ๋ฆฌ์ M3 MacBook Pro๋ 13B ๋ชจ๋ธ ์ ์ฒด๋ฅผ GPU ๋ฉ๋ชจ๋ฆฌ์์ ์คํํ์ฌ 50~80ํ ํฐ/์ด๋ฅผ ๋ฌ์ฑํฉ๋๋ค.
VRAM์ด ์ถฉ๋ถํ ๊ฒฝ์ฐ(8GB ์ด์), ๋ณ๋์ NVIDIA GPU๊ฐ ํ์ฌ๋ Windows ๋ ธํธ๋ถ์ด ๋ ๋น ๋ฅผ ์ ์์ต๋๋ค. NVIDIA RTX 4060 ๋ ธํธ๋ถ GPU(8GB VRAM)๋ 7B ๋ชจ๋ธ์ 60~90ํ ํฐ/์ด๋ก ์คํํฉ๋๋ค -- Apple M3 Pro์ ๋น์ทํ ์์ค์ ๋๋ค. ๋จ์ ์ ๋ฐฐํฐ๋ฆฌ ์๋ชจ๊ฐ ๋ง๊ณ ๋ฐ์ด์ด ๋๋ค๋ ๊ฒ์ ๋๋ค.
Intel Iris Xe ๋๋ AMD Radeon ๋ด์ฅ ๊ทธ๋ํฝ์ ์ฌ์ฉํ๋ Windows ๋ ธํธ๋ถ์ CPU ์ถ๋ก ๋ง ์ฌ์ฉํ๋ฏ๋ก, 7B ๋ชจ๋ธ์์ 8~20ํ ํฐ/์ด์ ๊ฒฐ๊ณผ๋ฅผ ๋ ๋๋ค.
| Laptop Type | Speed (7B) | Battery Drain | Max Model |
|---|---|---|---|
| Apple M3 Pro (18GB) | 50~80ํ ํฐ/์ด | ๋ณดํต | ~13B |
| Apple M2 (8GB) | 30~50ํ ํฐ/์ด | ๋ณดํต | ~7B |
| NVIDIA RTX 4060 ๋ ธํธ๋ถ (8GB VRAM) | 60~90ํ ํฐ/์ด | ๋์ | ~7B (GPU), ~13B (CPU ์คํ๋ก๋) |
| Intel i7 + Iris Xe (16GB RAM) | 8~15ํ ํฐ/์ด | ๋ณดํต | ~13B |
| AMD Ryzen 7 + ๋ด์ฅ GPU (16GB) | 10~18ํ ํฐ/์ด | ๋ณดํต | ~13B |
๋ก์ปฌ LLM์ ์ํ ๋ ธํธ๋ถ์ ๋ฐ์คํฌํ์ ๋นํด ์ถฉ๋ถํฉ๋๊น?
๋ ธํธ๋ถ์ 3B~13B ๋ชจ๋ธ์ ํจ๊ณผ์ ์ผ๋ก ์คํํ์ง๋ง, ๋ ๋์ ๋๊ฐ ์์คํ ๊ณผ ์ ์ฉ GPU ๋๋ถ์ ๋ฐ์คํฌํ์ด ์ฑ๋ฅ ๋ฉด์์ ์ฐ์ธํฉ๋๋ค. RTX 4090(24GB VRAM)์ด ํ์ฌ๋ ๋ฐ์คํฌํ์ 70B ๋ชจ๋ธ์ 40~60ํ ํฐ/์ด๋ก ์คํํ์ง๋ง, ๋์ผํ ์์ ์ ๋ ธํธ๋ถ์์๋ CPU ์ถ๋ก ์ผ๋ก 1~3ํ ํฐ/์ด์ ์ฒ๋ฆฌํด์ผ ํฉ๋๋ค.
๋ ธํธ๋ถ์ ์ด๋์ฑ๊ณผ ์คํ์ ์ฌ์ฉ์ ํ์ฉํ์ญ์์ค. ๋ํ ๋ชจ๋ธ(13B ์ด์), ์ง์์ ์ธ ์์ ๋ถํ, ๋๋ ํ๋ก๋์ ์ถ๋ก ์๋ ๋ฐ์คํฌํ์ ์ฌ์ฉํ์ญ์์ค. ํ๋ซํผ ์ ํ์ ๋ํ ์ ์ฒด ๋น์ฉ ๋ฐ ์ฑ๋ฅ ๋ถ์์ ๋ก์ปฌ LLM์ ์ํ ๋ ธํธ๋ถ vs ๋ฐ์คํฌํ ๊ตฌ๋งค ๊ฐ์ด๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
๋ ธํธ๋ถ์์ ์ด ์ฐ๋กํ๋ง์ ์ด๋ป๊ฒ ์ฒ๋ฆฌํฉ๋๊น?
์ด ์ฐ๋กํ๋ง์ CPU ๋๋ GPU๊ฐ ์จ๋ ํ๊ณ์ ๋๋ฌํ์ฌ ๋๊ฐ์ ์ํด ํด๋ญ ์๋๋ฅผ ๋ฎ์ถ ๋ ๋ฐ์ํฉ๋๋ค. ๋ก์ปฌ LLM ์ถ๋ก ์์๋ ์ง์์ ์ธ ์์ฑ ์์ 10~15๋ถ ํ์ ๋ฐ์ํ๋ฉฐ, ์๋๋ฅผ 20~40% ๊ฐ์์ํต๋๋ค.
- ํตํ์ด ๊ฐ๋ฅํ ๋ ธํธ๋ถ ์คํ ๋ ์ฌ์ฉ -- ๋ ธํธ๋ถ์ 2~3cm ๋์ด๋ฉด ๋ฐฐ๊ธฐ ํตํ์ด ๊ฐ์ ๋์ด ์ฐ๋กํ๋ง ๋ฐ์ ์์ ์ด 10๋ถ์์ 20๋ถ ์ด์์ผ๋ก ์ฐ์ฅ๋ฉ๋๋ค.
- Intel Turbo Boost / AMD Precision Boost ๋นํ์ฑํ -- ๊ธฐ๋ณธ ํด๋ญ ์๋๋ก ์คํํ๋ฉด ์ด ์คํ์ดํฌ ์์ด ์์ ์ ์ธ ์ฑ๋ฅ์ ๋ ๋๋ค. macOS์์๋ `cpufreq`๋ฅผ ์ค์นํ๊ฑฐ๋ ๋ฐฐํฐ๋ฆฌ ์ค์ ์ "์ ์ ๋ ฅ" ๋ชจ๋๋ฅผ ์ฌ์ฉํ์ญ์์ค.
- ์์ฑ ๋ฐฐ์น ํฌ๊ธฐ ์ ํ -- ๋งค์ฐ ๊ธด ์๋ต์ ์ฌ์์ฑํ๋ ๊ฒ์ ํผํ์ญ์์ค. ๊ธด ์์ ์ ๋ ์งง์ ํ๋กฌํํธ๋ก ๋๋์ญ์์ค.
- Q8_0 ๋์ Q4_K_M ์ฌ์ฉ -- ๋ฎ์ ์์ํ๋ ํ ํฐ๋น ๊ณ์ฐ๋์ด ์ ์ด ๋ฏธ๋ฏธํ ํ์ง ์ ํ ๋์ ๋ฐ์ด์ด ์ค์ด๋ญ๋๋ค.
๋ก์ปฌ LLM ์คํ ์ ๋ฐฐํฐ๋ฆฌ๊ฐ ์ผ๋ง๋ ์๋ชจ๋ฉ๋๊น?
๋ก์ปฌ ์ถ๋ก ์ค ๋ฐฐํฐ๋ฆฌ ์๋ชจ๋ ์๋นํฉ๋๋ค. 7B ๋ชจ๋ธ์ ํ์ฑ CPU ์ถ๋ก ์ ์ผ๋ฐ์ ์ธ ๋ ธํธ๋ถ CPU์์ 15~25W๋ฅผ ์๋นํ์ฌ, 60Wh ๋ฐฐํฐ๋ฆฌ ์์ถฉ ์ํ์์ ๋ฐฐํฐ๋ฆฌ ์๋ช ์ด 2~3์๊ฐ์ผ๋ก ์ค์ด๋ญ๋๋ค.
Apple Silicon์ ๋์ ๋๊ฒ ํจ์จ์ ์ ๋๋ค. M3 MacBook Pro๋ ์ถ๋ก ์ค 7B ๋ชจ๋ธ์์ ์ฝ 12~18W๋ฅผ ์๋นํ์ฌ, ์์ถฉ ์ํ์์ 3~4์๊ฐ์ ํ์ฑ ์์ฑ์ด ๊ฐ๋ฅํฉ๋๋ค.
์ฅ์๊ฐ ์ธ์ ์๋ ์ ์์ ์ฐ๊ฒฐํ์ญ์์ค. ๋ฐฐํฐ๋ฆฌ ํจ์จ์ ์ธ ๋ก์ปฌ ์ถ๋ก ์ด ํ์ํ๋ค๋ฉด Q4_K_M์ 3B ๋ชจ๋ธ์ ์ฌ์ฉํ์ญ์์ค -- 6~10W๋ฅผ ์๋นํ์ฌ ๋๋ถ๋ถ์ ๋ ธํธ๋ถ์์ ๋ฐฐํฐ๋ฆฌ ์๋ช ์ 5~6์๊ฐ๊น์ง ์ฐ์ฅํฉ๋๋ค.
๋ ธํธ๋ถ์์ ์ด๋ค ์์ํ ์์ค์ ์ฌ์ฉํด์ผ ํฉ๋๊น?
์์ํ๋ ๋ชจ๋ธ ์ ๋ฐ๋๋ฅผ ์ค์ฌ RAM๊ณผ ์ฐ์ฐ ์๊ตฌ ์ฌํญ์ ๋ฎ์ถฅ๋๋ค. ๋ ธํธ๋ถ์ ๊ฒฝ์ฐ Q4_K_M์ด ๊ถ์ฅ ๊ธฐ๋ณธ๊ฐ์ ๋๋ค:
| Quantization | RAM vs Full | Quality Loss | Use Case |
|---|---|---|---|
| Q2_K | ~25% | ๋์ -- ๋์ ๋๋ ํ์ง ์ ํ | ๊ทนํ ๋ฎ์ RAM์์๋ง |
| Q3_K_S | ~35% | ๋ณดํต | 4GB ๋ฏธ๋ง RAM |
| Q4_K_M | ~45% | ๋ฎ์ -- ๊ถ์ฅ ๊ธฐ๋ณธ๊ฐ | ๋๋ถ๋ถ์ ๋ ธํธ๋ถ, ์ต์ ์ ๊ท ํ |
| Q5_K_M | ~55% | ์ต์ | 16GB RAM ๋ ธํธ๋ถ |
| Q8_0 | ~80% | ๋ฌด์ํ ์ ์๋ ์์ค | 32GB RAM ๋๋ 8GB+ VRAM GPU |
๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM์ ์คํํ ๋ ์ ์ฉ๋๋ ๊ฐ์ธ์ ๋ณด ๋ณดํธ๋ฒ์ ๋ฌด์์ ๋๊น?
์ ๋ฝ์ฐํฉ (GDPR): ๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM์ ์คํํ๋ฉด ๋ชจ๋ ์ถ๋ก ์ด ๊ธฐ๊ธฐ์์ ์ด๋ฃจ์ด์ ธ ๋ฐ์ดํฐ๊ฐ ์ธ๋ถ๋ก ์ ์ก๋์ง ์์ต๋๋ค. ์ด๋ GDPR ์ 25์กฐ(์ค๊ณ์ ์ํ ๋ฐ์ดํฐ ๋ณดํธ)๋ฅผ ์ถฉ์กฑํ๋ฉฐ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๊ณ์ฝ์ ํ์์ฑ์ ์์ฑ๋๋ค. EU์ ๋ฒ๋ฅ , ์๋ฃ, ๊ธ์ต ๋ถ์ผ ์ ๋ฌธ๊ฐ๋ ํด๋ผ์ฐ๋ API ์ปดํ๋ผ์ด์ธ์ค ๋ถ๋ด ์์ด ๋ฏผ๊ฐํ ๊ณ ๊ฐ ๋ฐ์ดํฐ๋ฅผ ๋ก์ปฌ์์ ์ฒ๋ฆฌํ ์ ์์ต๋๋ค.
๋ ์ผ (DSGVO / BSI): BSI-Grundschutz-Kataloge(IT-Grundschutz)๋ "vertraulich"(๊ธฐ๋ฐ)๋ก ๋ถ๋ฅ๋ ๋ฐ์ดํฐ์ ๋ํด ๋ก์ปฌ ์ฒ๋ฆฌ๋ฅผ ๊ถ์ฅํฉ๋๋ค. ๋ ธํธ๋ถ ๊ธฐ๋ฐ ์ถ๋ก ์ ๊ธฐ์ ์ฉ ํด๋ผ์ฐ๋ ๊ณ์ฝ์ ์ ๋นํํ๊ธฐ ์ด๋ ค์ด ์ค์๊ธฐ์ ์ ๋ํ ์ด ์๊ตฌ์ฌํญ์ ์ถฉ์กฑํฉ๋๋ค.
์ผ๋ณธ (APPI): ์ผ๋ณธ์ ๊ฐ์ธ์ ๋ณด ๋ณดํธ์ ๊ดํ ๋ฒ๋ฅ (APPI, 2022๋ ๊ฐ์ )์ ๊ฐ์ธ ๋ฐ์ดํฐ์ ํด์ธ ์ด์ ์ ์๊ฒฉํ ๊ท์น์ ์ ์ฉํฉ๋๋ค. ๋ ธํธ๋ถ์์์ ๋ก์ปฌ LLM ์ถ๋ก ์ ๊ตญ๊ฒฝ ๊ฐ ์ ์ก ์ํ์ ์์ ํ ์ ๊ฑฐํ์ฌ, APPI ํ์ ๊ณ ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ์ผ๋ณธ ๊ธฐ์ ์ ์ ํฉํฉ๋๋ค.
๋ฏธ๊ตญ: 2026๋ 4์ ํ์ฌ ์ฐ๋ฐฉ AI ๋ฐ์ดํฐ ๋ฒ์ด ์์ง๋ง, ๋ถ์ผ๋ณ ๊ท์ ์ด ์ ์ฉ๋ฉ๋๋ค -- ์๋ฃ์ ๊ฒฝ์ฐ HIPAA(๋ก์ปฌ ์ถ๋ก ์ BAA ์๊ฑด ํํผ), ๊ต์ก์ ๊ฒฝ์ฐ FERPA, ์ฃผ๋ณ ๊ฐ์ธ์ ๋ณด ๋ณดํธ๋ฒ(์บ๋ฆฌํฌ๋์์ CCPA). ๋ก์ปฌ ๋ ธํธ๋ถ ์ถ๋ก ์ ๊ท์ ์ฐ์ ์ ๊ฐ์ฅ ์์ ํ ์ต์ ์ ๋๋ค.
๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM ์คํ์ ๊ดํ ์์ฃผ ๋ฌป๋ ์ง๋ฌธ
๋ก์ปฌ LLM์ ์คํํ๋ฉด ๋ ธํธ๋ถ์ด ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์์๋ฉ๋๊น?
์๋์ -- ํ๋์ CPU์ GPU๋ ์ด ์ฐ๋กํ๋ง์ ํตํด ์์ ํ๊ฒ ์ง์์ ์ธ ๊ณ ๋ถํ๋ฅผ ์ฒ๋ฆฌํ๋๋ก ์ค๊ณ๋์์ต๋๋ค. ์ฅ์๊ฐ ์ถ๋ก ์คํ์ ๋์์ ์ธ์ฝ๋ฉ์ด๋ ๊ฒ์๊ณผ ๋๋ฑํฉ๋๋ค. ๋ ธํธ๋ถ ์คํ ๋์ ์ถฉ๋ถํ ํ๊ธฐ๋ฅผ ํตํด ๊ณผ๋ํ ์ด ์ถ์ ์ ๋ฐฉ์งํ์ญ์์ค. ์ฅ์๊ฐ ์ถฉ์ ์ํ ์ ์ง๋ก ๋ฐฐํฐ๋ฆฌ ์ฌ์ดํด ์๊ฐ ์ฆ๊ฐํ๋ ๊ฒ์ ์ ์์ ์ธ ์๋ชจ ํจํด์ ๋๋ค.
4GB RAM ๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM์ ์คํํ ์ ์์ต๋๊น?
๊ฐ์ ํ ๊ฐ๋ฅํฉ๋๋ค. Gemma 2 2B์ ๊ฐ์ 2B ๋ชจ๋ธ์ ๋ชจ๋ธ์ ์ฝ 1.7GB RAM์ด ํ์ํ์ง๋ง, OS๋ ๋์์ 2~3GB๊ฐ ํ์ํฉ๋๋ค. ์ด 4GB RAM์์๋ ์ค์ ์ฌ์ฉ์ด ๋ฐ์ํ์ฌ ์ถ๋ก ์๋๊ฐ 5~10๋ฐฐ ๋๋ ค์ง ์ ์์ต๋๋ค. ์ค์ฉ์ ์ธ ๊ฒฝํ์ ์ํ ์ต์ ์๊ฑด์ 8GB์ ๋๋ค.
๋ก์ปฌ LLM์ ์คํํ๋ ค๋ฉด ๋ ธํธ๋ถ์ ์ ์ฉ GPU๊ฐ ํ์ํฉ๋๊น?
์๋์. ์ฃผ์ ๋ก์ปฌ LLM ๋๊ตฌ(Ollama, LM Studio, GPT4All)๋ CPU๋ง์ผ๋ก๋ ์คํ๋ฉ๋๋ค. ์ ์ฉ GPU๋ ์ถ๋ก ์๋๋ฅผ ํฌ๊ฒ ๋์ฌ ์ฃผ์ง๋ง, 3B~7B ๋ชจ๋ธ์ CPU๋ง์ผ๋ก๋ 10~30ํ ํฐ/์ด์์ ์ค์ฉ์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํฉ๋๋ค. CPU์ ์ต์ ํ๋ ๋ชจ๋ธ ์ถ์ฒ์ ์ต๊ณ ์ ์ด๋ณด์์ฉ ๋ก์ปฌ LLM ๋ชจ๋ธ์ ์ฐธ์กฐํ์ญ์์ค.
8GB MacBook์์ ์คํํ ์ ์๋ ๊ฐ์ฅ ๋น ๋ฅธ ๋ก์ปฌ LLM์ ๋ฌด์์ ๋๊น?
Apple Silicon(M1, M2, M3)์ด ํ์ฌ๋ 8GB MacBook์์๋ Q4_K_M์ llama3.2:3b๊ฐ ๊ฐ์ฅ ์ค์ฉ์ ์ด๋ฉฐ -- Metal GPU๋ฅผ ํตํด 60~100ํ ํฐ/์ด๋ฅผ ๊ธฐ๋ํ ์ ์์ต๋๋ค. ์๋์ ํ์ง์ ๋ชจ๋ ์ํ๋ค๋ฉด mistral:7b๊ฐ M2 8GB์์ 30~50ํ ํฐ/์ด๋ก ์คํ๋๋ฉฐ ํตํฉ ๋ฉ๋ชจ๋ฆฌ์ ์ ์ฒด ๋ชจ๋ธ์ด ์ฌ๋ผ๊ฐ๋๋ค.
LLM ์ถ๋ก ์ค ๋ ธํธ๋ถ์ ์ด ์ฐ๋กํ๋ง์ ์ด๋ป๊ฒ ์ค์ ๋๊น?
์ธ ๋จ๊ณ๋ก ํด๊ฒฐํ์ญ์์ค: (1) ๊ธฐ๊ธฐ ์๋์ 2~3cm์ ํตํ ๊ณต๊ฐ์ด ์๋ ๋ ธํธ๋ถ ์คํ ๋๋ฅผ ์ฌ์ฉํ์ญ์์ค. (2) Intel์ Turbo Boost ๋๋ AMD Precision Boost๋ฅผ ๋นํ์ฑํํ์ญ์์ค -- ๊ธฐ๋ณธ ํด๋ญ ์๋๋ก ์คํํ๋ฉด ์ด ์คํ์ดํฌ๊ฐ ์ฌ๋ผ์ง๋๋ค. (3) Q8_0 ๋์ Q4_K_M ์์ํ๋ฅผ ์ฌ์ฉํ์ฌ ํ ํฐ๋น ์ฐ์ฐ๋๊ณผ ๋ฐ์ด์ ์ค์ด์ญ์์ค.
Chromebook์์ ๋ก์ปฌ LLM์ ์คํํ ์ ์์ต๋๊น?
Linux(Crostini)๊ฐ ํ์ฑํ๋ Chromebook์์๋ง ๊ฐ๋ฅํฉ๋๋ค. ๋๋ถ๋ถ์ Chromebook์ 4~8GB RAM๊ณผ ์ฝํ CPU๋ฅผ ๊ฐ์ถ๊ณ ์์ด Q4_K_M์ 2B~3B ๋ชจ๋ธ์ ์คํํ ์ ์์ง๋ง, 5~15ํ ํฐ/์ด๋ฅผ ์์ํ์ญ์์ค. Linux ์ง์์ด ์๋ Chromebook์์๋ ๋ก์ปฌ LLM์ ์คํํ ์ ์์ต๋๋ค.
Apple Silicon์ด ๋ก์ปฌ LLM์์ NVIDIA ๋ ธํธ๋ถ GPU๋ณด๋ค ๋ซ์ต๋๊น?
VRAM์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค. M3 Pro(18GB ํตํฉ ๋ฉ๋ชจ๋ฆฌ)๋ ์ ์ฒด ๋ชจ๋ธ์ด ๋น ๋ฅธ ๋ฉ๋ชจ๋ฆฌ์ ๋ค์ด๊ฐ๊ธฐ ๋๋ฌธ์ 13B ๋ชจ๋ธ์์ NVIDIA RTX 4060 ๋ ธํธ๋ถ(8GB VRAM)์ ๋ฅ๊ฐํฉ๋๋ค. 7B ๋ชจ๋ธ์์๋ ๋ ๋ค ๋น์ทํฉ๋๋ค -- M3 Pro์์ 50~80ํ ํฐ/์ด vs RTX 4060์์ 60~90ํ ํฐ/์ด. Apple Silicon์ ๋ฐฐํฐ๋ฆฌ ํจ์จ ๋ฉด์์ ์ฐ์๋ฅผ ์ ํฉ๋๋ค(12~18W vs 25~45W).
๋ชจ๋ธ์ด ๋ ธํธ๋ถ RAM๋ณด๋ค ํฌ๋ฉด ์ด๋ป๊ฒ ๋ฉ๋๊น?
Ollama์ LM Studio๋ ์ค์ ๋ฉ๋ชจ๋ฆฌ(๋์คํฌ ๋ฐฑ์ RAM)๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ถ๋ก ์๋๊ฐ 10~30ํ ํฐ/์ด ๋์ 1~5ํ ํฐ/์ด๋ก ๋๋ ค์ง๊ณ , ์ง์์ ์ธ ๋ฉ๋ชจ๋ฆฌ ์๋ฐ์ผ๋ก ๋ ธํธ๋ถ ํฌ์ด ์ต๊ณ ์๋๋ก ๋์๊ฐ๋๋ค. ํด๊ฒฐ์ฑ : ๋ ์์ ๋ชจ๋ธ ๋๋ ๋ ๋ฎ์ ์์ํ ์์ค(Q8_0 ๋์ Q4_K_M)์ ์ฌ์ฉํ์ญ์์ค.
๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM์ ์คํํ ๋ ๋ฐฐํฐ๋ฆฌ๋ ์ผ๋ง๋ ์ง์๋ฉ๋๊น?
์ผ๋ฐ์ ์ธ 60Wh ๋ฐฐํฐ๋ฆฌ ๊ธฐ์ค: CPU์์ 7B ๋ชจ๋ธ์ 15~25W๋ฅผ ์๋นํ์ฌ 2~3์๊ฐ์ ํ์ฑ ์ถ๋ก ์ด ๊ฐ๋ฅํฉ๋๋ค. Apple Silicon์ ๋ ํจ์จ์ (12~18W)์ผ๋ก 3~4์๊ฐ์ ์ ๊ณตํฉ๋๋ค. 3B ๋ชจ๋ธ์ 6~10W๋ฅผ ์๋นํ์ฌ ๋๋ถ๋ถ์ ๋ ธํธ๋ถ์์ ๋ฐฐํฐ๋ฆฌ๋ฅผ 5~6์๊ฐ๊น์ง ์ฐ์ฅํฉ๋๋ค. ํ๋ฃจ ์ข ์ผ ์ฌ์ฉํ๋ ค๋ฉด ์ ์์ ์ฐ๊ฒฐํ์ญ์์ค.
๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM์ ์คํํ๋ ค๋ฉด ์ธํฐ๋ท ์ฐ๊ฒฐ์ด ํ์ํฉ๋๊น?
์๋์. ๋ชจ๋ธ์ ๋ค์ด๋ก๋ํ ํ(์ธํฐ๋ท ํ์), ์ถ๋ก ์ ์์ ํ ์คํ๋ผ์ธ์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค. ๋ชจ๋ธ์ ์ ์ ์ผ๋ก ๋ ธํธ๋ถ CPU ๋๋ GPU์์ ์คํ๋ฉ๋๋ค. ์ด ๋๋ถ์ ๋ก์ปฌ LLM์ ์ฌํ, ๋ณด์ ํ๊ฒฝ, ๋๋ ์ธํฐ๋ท ์ฐ๊ฒฐ์ด ๋ถ์์ ํ ์ฅ์์์ ์ ์ฉํฉ๋๋ค.
8GB RAM์์ ๋ก์ปฌ LLM์ ์คํํ ์ ์์ต๋๊น?
๋ค. 8GB ๋ ธํธ๋ถ์ Q4_K_M ์์ํ(4.5GB)์ 7B ๋ชจ๋ธ์ CPU์์ 10~25ํ ํฐ/์ด, Apple Silicon์์ 30~80ํ ํฐ/์ด๋ก ์คํํฉ๋๋ค.
๋ก์ปฌ LLM์ ์ํ ๊ฐ์ฅ ๋น ๋ฅธ ๋ ธํธ๋ถ์ ๋ฌด์์ ๋๊น?
24~48GB ํตํฉ ๋ฉ๋ชจ๋ฆฌ์ Apple MacBook Pro M4 Pro/Max๋ 13B ๋ชจ๋ธ์์ 80~120ํ ํฐ/์ด์ ๋๋ฌํฉ๋๋ค. Windows์์๋ NVIDIA RTX 4070/4090 ๋ ธํธ๋ถ GPU(8~16GB VRAM)๊ฐ 7B ๋ชจ๋ธ์์ 60~130ํ ํฐ/์ด๋ฅผ ๋ฌ์ฑํฉ๋๋ค.
๋ก์ปฌ LLM์ GPU๊ฐ ํ์ํฉ๋๊น?
์๋์ โ Ollama์ LM Studio๋ CPU๋ง์ผ๋ก๋ ์คํ๋ฉ๋๋ค. GPU๋ 7B ๋ชจ๋ธ์์ ์ถ๋ก ์๋๋ฅผ 10~25ํ ํฐ/์ด์์ 50~90ํ ํฐ/์ด๋ก ๋์ฌ ์ฃผ์ง๋ง ํ์์ ์ด์ง๋ ์์ต๋๋ค.
CPU์์ ๋ก์ปฌ LLM์ ์ผ๋ง๋ ๋๋ฆฝ๋๊น?
Q4_K_M์ 7B ๋ชจ๋ธ์ ์ต์ ๋ ธํธ๋ถ CPU์์ 10~25ํ ํฐ/์ด๋ก ์คํ๋ฉ๋๋ค โ ์ฝ์ผ๋ฉด์ ๋ฐ๋ผ๊ฐ ์ ์์ ๋งํผ ๋๋ฆฌ์ง๋ง ์ฑํ ๊ณผ ์์ฝ์๋ ์ถฉ๋ถํ ๋น ๋ฆ ๋๋ค. Apple Silicon์ ํตํฉ ๋ฉ๋ชจ๋ฆฌ๋ฅผ GPU๋ก ์ฌ์ฉํ์ฌ 30~80ํ ํฐ/์ด์ ๋๋ฌํฉ๋๋ค.
LLM ์คํ์ด ๋ ธํธ๋ถ์ ์์์ํต๋๊น?
์๋์. CPU์ GPU๋ ์ด ์ฐ๋กํ๋ง์ ํตํด ์ง์์ ์ธ ๋ถํ๋ฅผ ๊ฒฌ๋ ์ ์๋๋ก ์ค๊ณ๋์์ต๋๋ค. ํตํ์ ์ํ ๋ ธํธ๋ถ ์คํ ๋์ ๊ฐํ์ ์ธ ํด์์ผ๋ก ๊ณผ๋ํ ์ด์ ๋ฐฉ์งํ์ญ์์ค. ์ผ๋ฐ์ ์ธ ํฌ ์์์ ์์์ ์ ํธ๊ฐ ์๋๋๋ค.
์ถ์ฒ
- Apple MLX Framework -- Apple Silicon Mac์ฉ GPU ๊ฐ์. https://github.com/ml-explore/mlx
- Ollama Documentation -- CPU/GPU ์ถ๋ก ๊ตฌ์ฑ ๋ฐ macOS ์ต์ ํ. https://ollama.com
- LM Studio -- ์์คํ ์๊ตฌ ์ฌํญ, GPU ํธํ์ฑ, ๋ก์ปฌ ์ถ๋ก ์ค์ . https://lmstudio.ai
๋ ธํธ๋ถ์์ ๋ก์ปฌ LLM์ ์คํํ ๋ ํํ ํ๋ ์ค์๋ ๋ฌด์์ ๋๊น?
- ์ฌ์ฉ ๊ฐ๋ฅํ RAM๋ณด๋ค ํฐ ๋ชจ๋ธ ์คํ โ ๋์คํฌ๋ก ์ค์๋์ด ์ถ๋ก ์๋๊ฐ 10~25ํ ํฐ/์ด์์ 1~3ํ ํฐ/์ด๋ก ๋๋ ค์ง๋๋ค.
- ์ด ์ฐ๋กํ๋ง ๋ฌด์ โ ์ถ๋ก 10~15๋ถ ํ ์ง์ ์๋๊ฐ 20~40% ๊ฐ์ํฉ๋๋ค.
- Q4_K_M ๋์ Q8_0 ์ฌ์ฉ โ ๋ ธํธ๋ถ ํ๋์จ์ด์์ ์ธ์ง ๊ฐ๋ฅํ ํ์ง ํฅ์ ์์ด RAM ์ฌ์ฉ๋์ด ๋ ๋ฐฐ๋ก ๋์ด๋ฉ๋๋ค.
- LM Studio์์ GPU ๊ฐ์ ๋ฏธํ์ฑํ โ Apple Silicon ์ฒ๋ฆฌ๋์ด 50~80ํ ํฐ/์ด์์ 10~20ํ ํฐ/์ด๋ก ๋จ์ด์ง๋๋ค.
- Ollama์ ๊ธฐ๋ณธ 2,048ํ ํฐ ์ปจํ ์คํธ ์ฐฝ ์ฌ์ฉ โ ์ฌ๋ฌ ํ์ด์ง ๋ฌธ์๊ฐ ์๋ฆฝ๋๋ค. Modelfile์์ `num_ctx 8192`๋ฅผ ์ค์ ํ์ญ์์ค.