Key Takeaways
- ํ์ธํ๋(๊ถ์ฅ): VRAM 8 GB, ํ์ต ์์ 500๊ฐ ์ด์, 1~4์๊ฐ. ๋น์ฉ: $100~500.
- ์ฌ์ ํ์ต: GPU 8๊ฐ ์ด์, ํ ํฐ 1,000์ต ๊ฐ ์ด์, ์ ์ฃผ๊ฐ ํ์ต. ๋น์ฉ: $5๋ง~50๋ง.
- ๋๋ถ๋ถ์ ์กฐ์ง์ ์ฌ์ ํ์ต์ด ์๋ ํ์ธํ๋์ ํด์ผ ํฉ๋๋ค. ์ปค์คํ ์ฌ์ ํ์ต์ ์ํ ์ฒด๊ฐ์ด ๋ฐ์ํฉ๋๋ค.
- ์ต์ ์ ์ ๊ทผ ๋ฐฉ์: ๋๋ฉ์ธ ๋ฐ์ดํฐ๋ก ํ์ธํ๋์ ์์ํ ๋ค์ ์ฌ์ ํ์ต์ด ์ ๋นํ๋๋์ง ํ๊ฐํ์ญ์์ค.
- 2026๋ 4์ ๊ธฐ์ค, ๋ ์ ๋ชจ๋ธ์ด ํ์ํ ๊ฒฝ์ฐ๊ฐ ์๋๋ฉด ์ฌ์ ํ์ต์ ๊ฑฐ์ ์ ๋นํ๋์ง ์์ต๋๋ค.
ํ์ธํ๋ vs ์ฌ์ ํ์ต
| Aspect | Fine-Tuning | Pre-Training |
|---|---|---|
| ํ์ต ์๊ฐ | 1~4์๊ฐ | ์ ์ฃผ~์ ๊ฐ์ |
| ํ์ VRAM | 8 GB | 100+ GB (๋ฉํฐ GPU) |
| ํ์ ๋ฐ์ดํฐ | ์์ 500~5,000๊ฐ | ํ ํฐ 1,000์ต ๊ฐ ์ด์ |
| ๋น์ฉ | $100~500 | $5๋ง~50๋ง |
| ์ปค์คํฐ๋ง์ด์ ์ด์ | ๋๋ฉ์ธ ์ง์ | ๋ ์ ๋ชจ๋ธ |
| ์ฌ์ฉ ์๊ธฐ | 99%์ ๊ฒฝ์ฐ | ๋๋ฌผ๊ณ ํน์ํ ํ์ |
ํ์ธํ๋ ๊ฒฝ๋ก (๊ถ์ฅ)
- 1๋๋ฉ์ธ ํนํ ์์ 500~5,000๊ฐ ์์ง (ํ์ง์ด ์ค์ํฉ๋๋ค).
- 2๊ธฐ๋ณธ ๋ชจ๋ธ ์ ํ (Llama 3.3 8B, Qwen 7B ๋ฑ).
- 3ํจ์จ์ ์ธ ํ์ต์ ์ํด LoRA ์ฌ์ฉ (4๋ฐฐ ๋น ๋ฆ, ๋์ผํ ํ์ง).
- 4GPU์์ 3~5 ์ํฌํฌ ํ์ต.
- 5ํ ์คํธ ์ธํธ์์ ํ๊ฐ (์ ๋ฐ๋, ์ฌํ์จ, ์ปค์คํ ์งํ).
- 6LoRA ์ด๋ํฐ๋ฅผ ๊ธฐ๋ณธ ๋ชจ๋ธ์ ๋ณํฉ.
- 7ํ๋ก๋์ ๋ชจ๋ธ๋ก ๋ฐฐํฌ.
LoRA vs ์ ์ฒด ํ์ธํ๋: ๋ฌด์์ ์ ํํด์ผ ํฉ๋๊น?
LoRA(Low-Rank Adaptation)๋ ๋ชจ๋ธ ๊ฐ์ค์น์ 1~2%๋ง ์ ๋ฐ์ดํธํ์ฌ ์ ์ฒด ํ์ธํ๋๋ณด๋ค 4๋ฐฐ ๋น ๋ฅด๊ณ VRAM์ 80~90% ๋ ์ฌ์ฉํฉ๋๋ค. ์ ์ฒด ํ์ธํ๋์ ๋ชจ๋ ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธํ์ฌ ์ฝ๊ฐ ๋ ๋์ ๊ฒฐ๊ณผ(์ ํ๋ 2~5% ํฅ์)๋ฅผ ์ ๊ณตํ์ง๋ง VRAM 64+ GB์ ์๋นํ ์ฐ์ฐ ์์์ด ํ์ํฉ๋๋ค.
๋ชจ๋ธ ํฌ๊ธฐ๋ณ VRAM ์๊ตฌ์ฌํญ
LoRA ํ์ธํ๋์ ์ํด ๋ชจ๋ ๋ชจ๋ธ์ด VRAM 8 GB์ ๋ง๋ ๊ฒ์ ์๋๋๋ค. ์คํ ๊ฐ๋ฅํ ๊ฒ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
์ปค์คํ ๋ชจ๋ธ์ Ollama์ ๋ฐฐํฌํ๊ธฐ
LoRA ์ด๋ํฐ ๋ณํฉ ํ 3๋จ๊ณ๋ก Ollama์ ๋ฐฐํฌํ์ญ์์ค:
- 11๋จ๊ณ โ GGUF๋ก ๋ด๋ณด๋ด๊ธฐ: llama.cpp์ ๋ณํ ์คํฌ๋ฆฝํธ๋ฅผ ์ฌ์ฉํ์ฌ ๋ณํฉ๋ ๋ชจ๋ธ์ PyTorch/safetensors ํ์์์ GGUF๋ก ๋ณํํ์ญ์์ค. ์ด๋ Ollama ๋ฐ llama.cpp ํธํ์ฑ์ ํ์์ ์ ๋๋ค. ```bash python convert_hf_to_gguf.py \ --model ./merged-model \ --outfile ./my-custom-model.gguf \ --outtype q4_k_m ```
- 22๋จ๊ณ โ Ollama Modelfile ์์ฑ: ๋ชจ๋ธ์ ์์คํ ํ๋กฌํํธ, ํ๋ผ๋ฏธํฐ ๋ฐ ์ถ๋ก ์ค์ ์ ์ ์ํ์ญ์์ค. ``` FROM ./my-custom-model.gguf SYSTEM "You are a [your domain] expert..." PARAMETER temperature 0.4 PARAMETER num_ctx 4096 ```
- 33๋จ๊ณ โ ๋ฑ๋ก ๋ฐ ์คํ: ๋ก์ปฌ ๋๋ API ์ ๊ทผ์ ์ํด ๋ชจ๋ธ์ Ollama์ ๋ก๋ํ์ญ์์ค. ```bash ollama create my-custom-model -f Modelfile ollama run my-custom-model ``` ํ์ธํ๋๋ ๋ชจ๋ธ์ด ์ด์ localhost:11434์์ Ollama์ OpenAI ํธํ API๋ฅผ ํตํด ์ ๊ทผ ๊ฐ๋ฅํฉ๋๋ค โ ํ์ค Ollama ๋ชจ๋ธ๊ณผ ๋์ผํฉ๋๋ค. Continue.dev, Open WebUI ๋๋ Python/Node.js OpenAI SDK๋ฅผ ํตํ ์์ฒด ์ ํ๋ฆฌ์ผ์ด์ ๊ณผ ํจ๊ป ์ฌ์ฉํ์ญ์์ค.
์ฌ์ ํ์ต: ์ธ์ ๊ทธ๋ฆฌ๊ณ ์
์ฌ์ ํ์ต์ ์์ ๋ฐ์ดํฐ(์ฑ , ๋ฌธ์, ์ฝ๋)์์ ํ์ตํ๋ ๊ฒ์ ์๋ฏธํฉ๋๋ค. ๋ค์ ๊ฒฝ์ฐ์๋ง ์ ๋นํ๋ฉ๋๋ค:
1. ๊ณ ์ ํ๊ณ ๊ฐ์น ์๋ ๋ฐ์ดํฐ๊ฐ 100์ต ํ ํฐ ์ด์ ์์ ๋.
2. ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ด ๊ทํ์ ๋๋ฉ์ธ์์ ์ง์์ ์ผ๋ก ์คํจํ ๋.
3. ์์ฐ์ด $5๋ง ์ด์์ผ ๋ (ํ์ค์ ์ธ ๋น์ฉ).
4. ๊ฒฝ์ ์ฐ์๋ฅผ ์ํ ๋ ์ ๋ชจ๋ธ์ด ํ์ํ ๋.
์์: 500GB์ ๋น๊ณต๊ฐ ์ฐ๊ตฌ ๋ฐ์ดํฐ๋ฅผ ๋ณด์ ํ ์ ์ ์ฒดํ ํ์ฌ๋ ์ปค์คํ ์ฌ์ ํ์ต์ ์ ๋นํํ ์ ์์ต๋๋ค.
์์ฌ๊ฒฐ์ ๋งคํธ๋ฆญ์ค: ์ด๋ค ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํด์ผ ํฉ๋๊น?
์ปค์คํ ๋ชจ๋ธ์ ์ํ ์ธ ๊ฐ์ง ์ฃผ์ ์ ๊ทผ ๋ฐฉ์์ด ์์ต๋๋ค. ๋ฐ์ดํฐ, ์์ฐ ๋ฐ ์ผ์ ์ ๋ฐ๋ผ ์ ํํ์ญ์์ค:
๋๋ฉ์ธ ์ ์ ์ ๋ต
์ ์ฒด ์ฌ์ ํ์ต ์์ด ๋๋ฉ์ธ์์ ๋ชจ๋ธ ์ฑ๋ฅ์ ํฅ์์ํค๋ ๋ฐฉ๋ฒ:
- ์ง์์ ์ฌ์ ํ์ต: ๊ธฐ๋ณธ ๋ชจ๋ธ์ ๊ฐ์ ธ์ ๋๋ฉ์ธ ๋ฐ์ดํฐ(100์ต ํ ํฐ ์ด์)๋ก ํ์ต. ์ ์ฒด ์ฌ์ ํ์ต๋ณด๋ค ์ ๋ ดํฉ๋๋ค.
- LoRA ํ์ธํ๋: ๊ฐ์ฅ ์ค์ฉ์ ์ ๋๋ค. ์์ 500๊ฐ ์ด์์ผ๋ก ํ๋.
- ํ๋กฌํํธ ์์ง๋์ด๋ง: ์ข์ ํ๋กฌํํธ ์ ์. ๋ฌด๋ฃ์ด๋ ํ๊ณ๊ฐ ์์ต๋๋ค.
- RAG: ๋ฌธ์ ๊ฒ์, ์ปจํ ์คํธ ์ ๊ณต. ์ฌํ์ต ์์ด ์๋ํฉ๋๋ค.
- ์์๋ธ: ์ฌ๋ฌ ๋ชจ๋ธ ๊ฒฐํฉ.
ํ๊ฐ ์งํ
๋ชจ๋ธ ํ์ง ์ธก์ :
- ๊ณผ์ ๋ณ ์งํ: ์ ํ๋, F1 ์ ์, BLEU (ํ ์คํธ ์์ฑ์ฉ).
- ๋ฒค์น๋งํฌ ํ ์คํธ: ํ์ค ๋ฒค์น๋งํฌ(MMLU, HumanEval)์์ ์คํ.
- ์ธ๊ฐ ํ๊ฐ: ์๋ ์ฑ์ (์๊ฐ ์๋ชจ์ ์ด๋ ์ ํํจ).
- ๋น์ฆ๋์ค ์งํ: ๋ชจ๋ธ์ด ์ค์ ๋น์ฆ๋์ค ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ ํฉ๋๊น?
ํํ ์ค์
- ์ถฉ๋ถํ ๋ฐ์ดํฐ ์์ด ์ฌ์ ํ์ต. ํ ํฐ 100์ต ๊ฐ ๋ฏธ๋ง์ ์ฐ์ฐ ์์ ๋ญ๋น์ ๋๋ค. ํ์ธํ๋์ ๋์ ์ฌ์ฉํ์ญ์์ค.
- ์ฌ๋ฐ๋ฅด๊ฒ ํ๊ฐํ์ง ์์. ํ์ต ์์ค๋ง ๋ณด๋ ๊ฒ์ ์คํด๋ฅผ ๋ถ๋ฌ์ผ์ผํต๋๋ค. ๋ฏธ๊ณต๊ฐ ๋ฐ์ดํฐ์์ ํ ์คํธํ์ญ์์ค.
- ์ปค์คํ ๋ชจ๋ธ์ด GPT-4์ ๋์ผํ ๊ฒ์ด๋ผ๋ ๊ธฐ๋. ์คํ ๋ชจ๋ธ๊ณผ ํ๋ก ํฐ์ด ๋ชจ๋ธ ๊ฐ์ ๊ฒฉ์ฐจ๋ ํฝ๋๋ค.
- ์ถ๋ก ๋น์ฉ ๋ฌด์. ๋ ํฐ ์ปค์คํ ๋ชจ๋ธ = ๋ ๋์ ์ถ๋ก ๋น์ฉ. ํธ๋ ์ด๋์คํ๋ฅผ ๊ณ ๋ คํ์ญ์์ค.
- GGUF ๋ณํ ๋จ๊ณ ๊ฑด๋๋. Unsloth ๋๋ HuggingFace๋ก ํ์ธํ๋ ํ ๋ชจ๋ธ์ PyTorch/safetensors ํ์์ ๋๋ค. Ollama์ llama.cpp๋ GGUF๋ฅผ ์๊ตฌํฉ๋๋ค. llama.cpp์ `convert_hf_to_gguf.py`๋ฅผ ์ฌ์ฉํ์ฌ ๋ณํํ์ญ์์ค. ์ด ๋จ๊ณ ์์ด๋ ํ์ธํ๋๋ ๋ชจ๋ธ์ด Ollama, LM Studio ๋๋ GGUF ๊ธฐ๋ฐ ์ถ๋ก ์์ง์์ ์คํ๋ ์ ์์ต๋๋ค. ํ์ผ ํฌ๊ธฐ๋ฅผ 3~4๋ฐฐ ์ค์ด๊ธฐ ์ํด ๋ณํ ์ค์ ํญ์ ์์ํํ์ญ์์ค(Q4_K_M ๊ถ์ฅ).
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
ํ์ธํ๋์ด ์ฌ์ ํ์ต ๋ชจ๋ธ์ ํ์ง์ ํ์ ํ ์ ์์ต๋๊น?
ํ์ธํ๋๋ ๋ชจ๋ธ์ ํน์ ๋๋ฉ์ธ์์ ๊ธฐ๋ณธ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋ฅ๊ฐํ ์ ์์ง๋ง, ๋ ํฐ ์ฌ์ ํ์ต ๋ชจ๋ธ์ ๊ด๋ฒ์ํ ์ง์์๋ ๋ฏธ์น์ง ๋ชปํฉ๋๋ค. ๋ฒ๋ฅ ๋ฌธ์๋ก ํ์ธํ๋๋ Llama 3.3 8B๋ ๋ฒ๋ฅ ๊ณผ์ ์์ Llama 3.3 70B๋ฅผ ๋ฅ๊ฐํ์ง๋ง, ์ผ๋ฐ ์ง์์์๋ ์ฑ๋ฅ์ด ๋ฎ์ต๋๋ค. ๋๋ฉ์ธ ํนํ ์ ํ๋๊ฐ ํญ๋์ ์ง์๋ณด๋ค ์ค์ํ ๋ ํ์ธํ๋์ ์ ํํ์ญ์์ค.
ํจ๊ณผ์ ์ผ๋ก ํ์ธํ๋ํ๋ ค๋ฉด ์ผ๋ง๋ ๋ง์ ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๊น?
์ฌ์ฉ ๊ฐ๋ฅํ ๋ชจ๋ธ์ ์ํด ์ต์ 500~1,000๊ฐ์ ์์๊ฐ ํ์ํ๋ฉฐ, ํ๋ก๋์ ํ์ง์ ์ํด์๋ 5,000๊ฐ ์ด์์ด ํ์ํฉ๋๋ค. ์๋ณด๋ค ํ์ง์ด ๋ ์ค์ํฉ๋๋ค โ ๊ณ ํ์ง ์์ 1,000๊ฐ๊ฐ ์ ํ์ง ์์ 50,000๊ฐ๋ณด๋ค ๋ซ์ต๋๋ค. ์๊ท๋ชจ ๋ฐ์ดํฐ์ (500~2,000๊ฐ)์๋ LoRA๋ฅผ ์ฌ์ฉํ๊ณ , ์ ์ฒด ํ์ธํ๋์ 10,000๊ฐ ์ด์์ ์์๊ฐ ์์ ๋๋ง ์ฌ์ฉํ์ญ์์ค.
LoRA์ ์ ์ฒด ํ์ธํ๋์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
LoRA(Low-Rank Adaptation)๋ ์ ์ฒด ํ์ธํ๋์ ๋นํด ๊ฐ์ค์น์ ์ฝ 1~2%๋ง ์ ๋ฐ์ดํธํ์ฌ 4๋ฐฐ ๋น ๋ฅด๊ณ VRAM์ 80~90% ๋ ์ฌ์ฉํฉ๋๋ค. ์ ์ฒด ํ์ธํ๋์ ๋ชจ๋ ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธํ์ฌ ์ฝ๊ฐ ๋ ๋์ ๊ฒฐ๊ณผ(์ ํ๋ 2~5% ํฅ์)๋ฅผ ์ ๊ณตํ์ง๋ง ์๋นํ ์ฐ์ฐ ์์์ด ํ์ํฉ๋๋ค. ๋๋ถ๋ถ์ ํ๋ก์ ํธ์๋ LoRA๋ฅผ ์ฌ์ฉํ๊ณ , ์ ์ฒด ํ์ธํ๋์ ์์ฐ์ด ์ถฉ๋ถํ ๋๋ง ์ฌ์ฉํ์ญ์์ค.
ํ์ธํ๋ ๋์ ์ฌ์ ํ์ต์ ๊ณ ๋ คํด์ผ ํ๋ ๊ฒฝ์ฐ๋ ์ธ์ ์ ๋๊น?
๋ค์ ๊ฒฝ์ฐ์๋ง ํด๋นํฉ๋๋ค: (1) ๊ณ ์ ํ ๋ฐ์ดํฐ๊ฐ 100์ต ํ ํฐ ์ด์ ์์ ๋, (2) ํ์ธํ๋์ผ๋ก ๋ชฉํ ์ ํ๋์ ์ง์์ ์ผ๋ก ๋๋ฌํ์ง ๋ชปํ ๋, (3) ์์ฐ์ด $5๋ง ์ด์์ผ ๋, (4) ๊ฒฝ์ ์ฐ์๋ฅผ ์ํ ๋ ์ ๋ชจ๋ธ์ด ํ์ํ ๋. 99%์ ์กฐ์ง์๋ ํ์ธํ๋์ด ์ฌ๋ฐ๋ฅธ ์ ํ์ ๋๋ค.
์ปค์คํ ๋ชจ๋ธ์ด ํ๋ก๋์ ์ค๋น๊ฐ ๋์๋์ง ์ด๋ป๊ฒ ํ๊ฐํฉ๋๊น?
3๊ฐ์ง ์ฐจ์์์ ํ ์คํธํ์ญ์์ค: (1) ๊ณผ์ ๋ณ ์งํ(์ ํ๋, F1, BLEU), (2) ๋ฒค์น๋งํฌ ๋น๊ต(MMLU ๋๋ HumanEval๋ก ๊ธฐ๋ณธ ๋ชจ๋ธ๊ณผ ๋น๊ต), (3) ๋น์ฆ๋์ค ์งํ(์ค์ ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ ํฉ๋๊น?). ํ์ธํ๋๋ ๋ชจ๋ธ์ด ํด๋น ๊ณผ์ ์์ ๊ธฐ๋ณธ ๋ชจ๋ธ๋ณด๋ค 5~10% ์ฐ์ํ๋ค๋ฉด ํ๋ก๋์ ์ค๋น๊ฐ ๋ ๊ฒ์ ๋๋ค.
๋ ๋์ ๊ฒฐ๊ณผ๋ฅผ ์ํด ํ์ธํ๋๊ณผ ํ๋กฌํํธ ์์ง๋์ด๋ง์ ๊ฒฐํฉํ ์ ์์ต๋๊น?
์ โ ์ด๊ฒ์ด ๋ชจ๋ฒ ์ฌ๋ก์ ๋๋ค. ํ์ธํ๋์ ๊ตฌ์กฐ์ ๋ณํ(๋๋ฉ์ธ ์ธ์ด, ํ์)๋ฅผ ์ฒ๋ฆฌํ๊ณ , ํ๋กฌํํธ ์์ง๋์ด๋ง์ ํน์ ์ฌ์ฉ ์ฌ๋ก๋ฅผ ์ฒ๋ฆฌํฉ๋๋ค. ํ์ธํ๋๋ ๋ฒ๋ฅ ๋ชจ๋ธ๊ณผ ์ข์ ํ๋กฌํํธ ์์ง๋์ด๋ง์ ๊ฒฐํฉํ๋ฉด ๋ ์ค ํ๋๋ง ์ฌ์ฉํ๋ ๊ฒ๋ณด๋ค ์ฑ๋ฅ์ด ๋ฐ์ด๋ฉ๋๋ค. ๋จผ์ ํ๋กฌํํธ ์ต์ ํ(๋ฌด๋ฃ)๋ก ์์ํ ๋ค์ ํ์์ ๋ฐ๋ผ ํ์ธํ๋ํ์ญ์์ค.
ํ์ธํ๋์ ์ด๋ค ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํด์ผ ํฉ๋๊น?
Unsloth(๊ฐ์ฅ ๋น ๋ฆ), Axolotl(์ ์ฐํจ), Hugging Face Transformers(๊ณต์, ๊ฐ์ฅ ๋ฌธ์ํ๋จ)๊ฐ ์ฃผ์ ์ ํ์ง์ ๋๋ค. ์๋๋ฅผ ์ํด์๋ Unsloth๋ฅผ ๊ถ์ฅํ๊ณ , ๋ฉํฐ GPU ์ค์ ์๋ Axolotl์ ๊ถ์ฅํฉ๋๋ค. ๋ชจ๋ LoRA๋ฅผ ์ง์ํ๋ฉฐ Ollama ๋ฐฐํฌ์ ํธํ๋ฉ๋๋ค.
์ฌ์ ํ์ต์ด ๋น์ฉ ๋๋น ๊ฐ์น๊ฐ ์๋์ง ์ด๋ป๊ฒ ์ ์ ์์ต๋๊น?
๋ค์ ๊ณ์ฐ์ ์ํํ์ญ์์ค: (1) ๊ณผ์ ์์ ํ์ธํ๋ ํ์ง ๊ฒฉ์ฐจ๋ฅผ ์ถ์ ํฉ๋๋ค(์: ํ์ธํ๋ 85%, ์ฌ์ ํ์ต 92% ๋๋ฌ ๊ฐ๋ฅ). (2) ์ ํ๋ ํฌ์ธํธ๋น ๋น์ฆ๋์ค ๊ฐ์น๋ฅผ ์ ๋ํํฉ๋๋ค(์: ์ ํ๋ +1% = ์์ต $1๋ง). (3) ($5๋ง ์ฌ์ ํ์ต ๋น์ฉ) < (7% ํฅ์์ ๊ฐ์น)์ด๋ฉด ์ฌ์ ํ์ตํ๊ณ , ๊ทธ๋ ์ง ์์ผ๋ฉด ํ์ธํ๋ํ์ญ์์ค.
์ปค์คํ ๋ชจ๋ธ์ ๋ํ ์ง์ญ๋ณ ๊ณ ๋ ค์ฌํญ
์ปค์คํ ๋ชจ๋ธ์ ์ง์ญ์ ๋ฐ๋ผ ๋ค๋ฅธ ๋ฐ์ดํฐ ํ๋ผ์ด๋ฒ์ ๋ฐ ๊ท์ ์ ํจ์๋ฅผ ๊ฐ์ง๋๋ค. ํ์ธํ๋๋๊ฑฐ๋ ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ๋ฐฐํฌํ๊ธฐ ์ ์ ์ง์ญ๋ณ ์ปดํ๋ผ์ด์ธ์ค ์๊ตฌ์ฌํญ์ ์ดํดํ์ญ์์ค:
- ์ ๋ฝ (GDPR): ๊ฐ์ธ ๋ฐ์ดํฐ๋ก ๋ชจ๋ธ์ ํ์ธํ๋ํ๋ ค๋ฉด ์ ๋ณด ์ฃผ์ฒด์ ๋์์ ์ฒ๋ฆฌ ๊ณ์ฝ ๋ฌธ์ํ๊ฐ ํ์ํฉ๋๋ค. GDPR ์ 5์กฐ(๋ฐ์ดํฐ ์ต์ํ)๋ ๊ฐ๋ฅํ ๊ฒฝ์ฐ ์ต๋ช ํ๋๊ฑฐ๋ ํฉ์ฑ๋ ๋ฐ์ดํฐ๋ก ํ์ธํ๋ํ ๊ฒ์ ๊ถ์ฅํฉ๋๋ค. ๋นEU ๋ฐ์ดํฐ๋ก ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ EU ์ง์ญ ๋ฐฐํฌ ์ ์ ์ถ๊ฐ ๊ฑฐ๋ฒ๋์ค๊ฐ ํ์ํ ์ ์์ต๋๋ค.
- ์ผ๋ณธ (APPI): ์ผ๋ณธ์ ๊ฐ์ธ์ ๋ณด ๋ณดํธ๋ฒ์ ๊ฐ์ธ ๋ฐ์ดํฐ ํ์ต์ ๋ํ ๋ช ์์ ๋์๋ฅผ ์๊ตฌํฉ๋๋ค. ์๋ฃ ๋๋ ๊ธ์ต ์๋น์ค๋ฅผ ์ํ ์ปค์คํ ๋ชจ๋ธ์ ๋ฐ์ดํฐ ๊ฑฐ์ฃผ(์ฒ๋ฆฌ๊ฐ ์ผ๋ณธ ๋ด์์ ์ด๋ฃจ์ด์ ธ์ผ ํจ)๊ฐ ํ์ํฉ๋๋ค. ์จํ๋ ๋ฏธ์ค ํ์ธํ๋ ๋ฐ ๋ฐฐํฌ๋ฅผ ๊ณ ๋ คํ์ญ์์ค.
- ์ค๊ตญ (DSL + CAC): ์ค๊ตญ์ ๋ฐ์ดํฐ ๋ณด์๋ฒ ๋ฐ ์ฌ์ด๋ฒ๊ณต๊ฐ๊ด๋ฆฌ๊ตญ ๊ท์ ์ ๊ฐ์ธ ๋ฐ ์ฐ์ ๋ฐ์ดํฐ์ ๋ก์ปฌ ์ฒ๋ฆฌ๋ฅผ ์๊ตฌํฉ๋๋ค. ์ค๊ตญ ๋ฐ์ดํฐ๋ก ํ์ต๋ ์ปค์คํ ๋ชจ๋ธ์ ์ค๊ตญ ์ธํ๋ผ์์ ํ์ต๋์ด์ผ ํฉ๋๋ค. ์ค๊ตญ ๋ฐฐํฌ๋ฅผ ์ํ ์ฌ์ ํ์ต ๋ชจ๋ธ์ CAC ๋ฑ๋ก์ด ํ์ํฉ๋๋ค.
- ๋ฏธ๊ตญ: ์ฐ๋ฐฉ LLM ๊ท์ ์์ (2026๋ 4์ ๊ธฐ์ค). ์ฃผ ์์ค ๊ท์ ์ ๋ค์ํ๋ฉฐ, ์บ๋ฆฌํฌ๋์ ๋ฒ๋ฅ ์ ์๊ณ ๋ฆฌ์ฆ ํฌ๋ช ์ฑ์ ์ด์ ์ ๋ง์ถฅ๋๋ค. ๊ธ์ต/์๋ฃ ๋ชจ๋ธ์ ๊ฒฝ์ฐ ๊ท์ ๊ธฐ๊ด(SEC, FDA, CMS)์ด ๋ฌธ์ํ ์๊ตฌ์ฌํญ์ ๋ถ๊ณผํ ์ ์์ต๋๋ค. ๋ชจ๋ธ ๋ณ๊ฒฝ์ ๋ํ ๊ฐ์ฌ ์ถ์ ์ ๊ณ ๋ คํ์ญ์์ค.
์ถ์ฒ
- Chinchilla Scaling Laws -- ํ์ต ๋ฐ ์ถ๋ก ์ ์ํ ์ต์ ์ฐ์ฐ ํ ๋น.
- Instruction Tuning Survey -- ํ์ธํ๋ ์ ๊ทผ ๋ฐฉ์์ ํฌ๊ด์ ๋ฆฌ๋ทฐ.
- LoRA: Low-Rank Adaptation -- ํจ์จ์ ์ธ ํ์ธํ๋ ๋ฐฉ๋ฒ.
- Hugging Face Fine-Tuning Guide -- ๊ณต์ ํ์ธํ๋ ๋ฌธ์.