LLM์ด๋ ์ค์ ๋ก ๋ฌด์์ธ๊ฐ
LLM(๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ)์ ์ ๋ ฅ ํ ํฐ ์ํ์ค๊ฐ ์ฃผ์ด์ก์ ๋ ๋ค์์ผ๋ก ๊ฐ์ฅ ํ๋ฅ ์ด ๋์ ํ ํฐ์ ์์ธกํ๋๋ก ํ์ต๋ ํธ๋์คํฌ๋จธ ๊ธฐ๋ฐ ์ ๊ฒฝ๋ง์ ๋๋ค โ ๋ฐ์ดํฐ๋ฒ ์ด์ค, ๊ฒ์ ์์ง, ๋๋ ์ถ๋ก ์์คํ ์ด ์๋๋๋ค. ๋ชจ๋ธ์ ํ์ต ์ค ์น ํ์ด์ง, ์ฑ , ์ฝ๋ ๋ฐ ๊ธฐํ ํ ์คํธ์์ ์์ฒ์ต ๊ฐ์ ๋จ์ด๋ฅผ ์ฒ๋ฆฌํจ์ผ๋ก์จ ํ ํฐ ๊ฐ์ ํต๊ณ์ ๊ด๊ณ๋ฅผ ํ์ตํฉ๋๋ค.
ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํ๋ฉด ๋ชจ๋ธ์ ํ ์คํธ๋ฅผ ์ซ์ ํ ํฐ ID ์ํ์ค๋ก ๋ณํํ๊ณ , ์ด๋ฅผ ์์ญ ๊ฐ์ ํธ๋์คํฌ๋จธ ๋ ์ด์ด๋ฅผ ํตํด ์ ๋ฌํ ๋ค, ์ ์ฒด ์ดํ(์ผ๋ฐ์ ์ผ๋ก 50,000โ100,000๊ฐ ํ ํฐ)์ ๋ํ ํ๋ฅ ๋ถํฌ๋ฅผ ์ถ๋ ฅํฉ๋๋ค. ๊ทธ ๋ถํฌ์์ ํ ํฐ ํ๋๋ฅผ ์ํ๋งํ์ฌ ์ํ์ค์ ์ถ๊ฐํ๊ณ , ์ ์ง ํ ํฐ์ด ์์ฑ๋๊ฑฐ๋ ์ถ๋ ฅ ํ๊ณ์ ๋๋ฌํ ๋๊น์ง ์ด ๊ณผ์ ์ ๋ฐ๋ณตํฉ๋๋ค.
์ด ์ํคํ ์ฒ๋ ์ฌ์ฉ์๋ค์ ํผ๋์ค๋ฝ๊ฒ ํ๋ ์ฌ๋ฌ ํ๋์ ์ค๋ช ํฉ๋๋ค: LLM์ด ๊ทธ๋ด๋ฏํ์ง๋ง ๊ฑฐ์ง๋ ์ฌ์ค์ "ํ๊ฐ"ํ๋ ์ด์ (๊ฒ์ฆ๋ ์ง์ค์ด ์๋ ํ๋ฅ ์ ์ผ๋ก ๊ทธ๋ด๋ฏํ ํ ์คํธ๋ฅผ ์์ธกํ๊ธฐ ๋๋ฌธ), ์ฐ์ ๊ณ์ฐ์ ์คํจํ ์ ์๋ ์ด์ (์ค์ ๊ณ์ฐ์ด ์๋ ํ ํฐ ํจํด ๋๋ฌธ), ๊ทธ๋ฆฌ๊ณ ํ๋กฌํํธ๋ฅผ ๋ฐ๊พธ๋ฉด ์ถ๋ ฅ์ด ๋ฌ๋ผ์ง๋ ์ด์ (์๋ก ๋ค๋ฅธ ํ ํฐ ์ํ์ค๊ฐ ์๋ก ๋ค๋ฅธ ํ๋ฅ ๋ถํฌ๋ฅผ ์ ๋ฐํ๊ธฐ ๋๋ฌธ)์ ๋๋ค.
| ์์ฑ | LLM | ์ ํต์ ์ธ ์ํํธ์จ์ด |
|---|---|---|
| ์๋ ๋ฐฉ์ | ํ์ต๋ ํ๋ฅ ๋ถํฌ๋ฅผ ํตํด ๋ค์ ํ ํฐ์ ์์ธก | ๊ฒฐ์ ๋ก ์ ๋ช ๋ น์ ์คํ |
| ์ถ๋ ฅ ๊ฒฐ์ ๋ก | ํ๋ฅ ์ โ ๋์ผํ ์ ๋ ฅ๋ ๋ค๋ฅธ ์ถ๋ ฅ์ ์์ฑํ ์ ์์ | ๊ฒฐ์ ๋ก ์ โ ๋์ผํ ์ ๋ ฅ์ ํญ์ ๋์ผํ ์ถ๋ ฅ์ ์์ฑ |
| ์ง์ ์ถ์ฒ | ํ์ต ์ค ๋ชจ๋ธ ๊ฐ์ค์น์ ์ธ์ฝ๋ฉ๋ ํจํด | ์คํ ์ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋๋ ํ์ผ์์ ์ฝ์ |
| ์ค๋ฅ ์ ํ | ์์ ๊ฐ ์์ง๋ง ํ๋ฆฐ (ํ๊ฐ) | ์ถฉ๋ ๋๋ ์ค๋ฅ ์ฝ๋ ๋ฐํ |
| ์ ๋ฐ์ดํธ ๋ฐฉ์ | ์ฌํ์ต ๋๋ ํ์ธํ๋ ํ์ | ์ฝ๋ ๋ณ๊ฒฝ ๋๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ ๋ฐ์ดํธ |
ํ ํฌ๋์ด์ ์ด์ : ํ ์คํธ๊ฐ ์ซ์๊ฐ ๋๋ ๋ฐฉ๋ฒ
**LLM์ด ํ ์คํธ๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ ์ ๋จผ์ ์ ์ ํ ํฐ ID ์ํ์ค๋ก ๋ณํํด์ผ ํฉ๋๋ค โ ์ด ๊ณผ์ ์ ํ ํฌ๋์ด์ ์ด์ ์ด๋ผ๊ณ ํฉ๋๋ค.** GPT-5.5๋ ์์ฃผ ๋ฑ์ฅํ๋ ์๋ธ์๋ ๋จ์๋ก ํ ์คํธ๋ฅผ ๋ถํ ํ๋ BPE(Byte Pair Encoding)๋ฅผ ์ฌ์ฉํฉ๋๋ค. Claude Opus 4.8๊ณผ Gemini 3.1 Pro๋ ์ ์ฌํ ์๋ธ์๋ ํ ํฌ๋์ด์ ์ด์ ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.
ํ ํฌ๋์ด์ ์ด์ ์ ์ธ์ด์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค. ์์ด ํ ์คํธ๋ ํ๊ท ์ ์ผ๋ก ๋จ์ด 0.75๊ฐ๋น ํ ํฐ 1๊ฐ์ ํด๋นํฉ๋๋ค. ์ค๊ตญ์ด์ ์ผ๋ณธ์ด๋ ๋จ์ด 0.5๊ฐ๋น ํ ํฐ 1๊ฐ์ ํด๋นํฉ๋๋ค โ ๋์ผํ ๋ฌธ์๊ฐ ์์ด๋ณด๋ค ์ค๊ตญ์ด๋ก ์์ฑ๋ ๋ ์ฝ ๋ ๋ฐฐ์ ํ ํฐ์ด ํ์ํ๋ฉฐ, ์ด๋ API ๋น์ฉ๊ณผ ์ปจํ ์คํธ ์๋์ฐ ์ฌ์ฉ์ ์ง์ ์ ์ธ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
| ์ ๋ ฅ ํ ์คํธ | ํ ํฐ | ํ ํฐ ์ |
|---|---|---|
| "Hello, world!" | "Hello", ",", " world", "!" | 4 |
| "Tokenization" | "Token", "ization" | 2 |
| "GPT-5.5" | "G", "PT", "-", "4", "o" | 5 |
| "ไฝ ๅฅฝไธ็" (์๋ ํ์ธ์, ์ค๊ตญ์ด) | "ไฝ ๅฅฝ", "ไธ็" | ๋ชจ๋ธ์ ๋ฐ๋ผ 2โ4 |
ํธ๋์คํฌ๋จธ ์ดํ ์ ์๋ ๋ฐฉ์
ํธ๋์คํฌ๋จธ ์ํคํ ์ฒ๋ ์ ํ ์ดํ ์ ์ด๋ผ๋ ๋ฉ์ปค๋์ฆ์ ์ฌ์ฉํ์ฌ ๊ฐ ํ ํฐ์ด ์์ ์ ํํ์ ๊ณ์ฐํ ๋ ์ํ์ค์ ๋ค๋ฅธ ๋ชจ๋ ํ ํฐ์ ์ผ๋ง๋ "์ฃผ์๋ฅผ ๊ธฐ์ธ์ฌ์ผ" ํ๋์ง๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. ๊ฐ ํ ํฐ์ ๋ํด ๋ชจ๋ธ์ ์ฟผ๋ฆฌ(Q), ํค(K), ๊ฐ(V)์ด๋ผ๋ ์ธ ๊ฐ์ ๋ฒกํฐ๋ฅผ ๊ณ์ฐํ๊ณ , Q์ K์ ๋ด์ ์ผ๋ก ์ดํ ์ ์ ์๋ฅผ ๊ณ์ฐํ ๋ค ์ํํธ๋งฅ์ค๋ก ์ค์ผ์ผ๋ง ๋ฐ ์ ๊ทํํฉ๋๋ค.
๋ฉํฐํค๋ ์ดํ ์ ์ ์ด ๊ณผ์ ์ ์ฌ๋ฌ "ํค๋"์์ ๋ณ๋ ฌ๋ก ์คํํฉ๋๋ค(GPT-5.5๋ ๊ฐ์ฅ ํฐ ๋ ์ด์ด์์ 96๊ฐ์ ์ดํ ์ ํค๋๋ฅผ ์ฌ์ฉํฉ๋๋ค). ๊ฐ ํค๋๋ ์๋ก ๋ค๋ฅธ ๊ด๊ณ ํจํด์ ํ์ตํฉ๋๋ค. ์ผ๋ถ ํค๋๋ ๊ตฌ๋ฌธ์ ๊ด๊ณ(์ฃผ์ด-๋์ฌ), ๋ค๋ฅธ ํค๋๋ ์๋ฏธ์ ์ ์ฌ์ฑ, ๋ ๋ค๋ฅธ ํค๋๋ ๊ณต์ฐธ์กฐ(๋๋ช ์ฌ๋ฅผ ๋ช ์ฌ์ ์ฐ๊ฒฐ)์ ํนํ๋ฉ๋๋ค.
ํต์ฌ์ ์ธ ์ค์ ์์ฌ์ ์ "์ค๊ฐ ์์ค" ํจ๊ณผ์ ๋๋ค. Stanford University์ Liu et al.(2023) ์ฐ๊ตฌ์ ๋ฐ๋ฅด๋ฉด LLM์ ๊ธด ์ปจํ ์คํธ์ ์ค๊ฐ ๋ถ๋ถ์ ์๋ ์ ๋ณด๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๊ณผ์ ํ๊ฐํฉ๋๋ค. 2,000 ํ ํฐ์ ์ด๊ณผํ๋ ํ๋กฌํํธ์ ๊ฒฝ์ฐ ์ค์ํ ์ง์์ฌํญ์ ์์คํ ํ๋กฌํํธ(์ฒ์)์ ๋ฐฐ์นํ๊ณ ๊ฐ์ฅ ์ค์ํ ์ ์ฝ ์กฐ๊ฑด์ ์ฌ์ฉ์ ๋ฉ์์ง ๋์ ๋ฐ๋ณตํ์ญ์์ค.
LLM ํ์ต ๋ฐฉ๋ฒ: ์ฌ์ ํ์ต๊ณผ RLHF
LLM ํ์ต์ ๋ ๊ฐ์ง ๋๋ ทํ ๋จ๊ณ๋ก ์ด๋ฃจ์ด์ง๋๋ค: ์ฌ์ ํ์ต(์์ ํ ์คํธ์์ ์ธ์ด ํจํด ํ์ต)๊ณผ ํ์ต ํ ์ ๋ ฌ(์ธ๊ฐ ํผ๋๋ฐฑ์ผ๋ก ํ๋ ํ์ฑ). ์ด ๋ ๋จ๊ณ๋ ์๋ก ๋ค๋ฅธ ๋ฅ๋ ฅ์ ๋ง๋ค์ด ๋ด๋ฉฐ, ์ ์ฌํ ๋ฒค์น๋งํฌ ์ ์์๋ ๋ถ๊ตฌํ๊ณ ์๋ก ๋ค๋ฅธ ์ฐ๊ตฌ์์ ๋ชจ๋ธ์ด ์ ๋ค๋ฅด๊ฒ ํ๋ํ๋์ง๋ฅผ ์ค๋ช ํฉ๋๋ค.
์ฌ์ ํ์ต ์ค์ ๋ชจ๋ธ์ ๋๊ท๋ชจ ์ฝํผ์ค๋ฅผ ์ฒ๋ฆฌํฉ๋๋ค โ Llama 3.3์ ์ฝ 15์กฐ ๊ฐ์ ํ ํฐ์ผ๋ก ํ์ต๋์์ผ๋ฉฐ, GPT-4๋ ์ฝ 1โ2์กฐ ๊ฐ์ ํ ํฐ์ผ๋ก ์ถ์ ๋ฉ๋๋ค. ๋ชฉํ๋ ๋จ์ํฉ๋๋ค: ๋ค์ ํ ํฐ์ ์์ธกํ๋ ๊ฒ์ ๋๋ค. ๋ช ์์ ์ธ ์ง์์ ์ ์ฅ๋์ง ์์ผ๋ฉฐ, ๋ชจ๋ ์ ๋ณด๋ ํต๊ณ์ ํจํด์ผ๋ก ๋ชจ๋ธ ๊ฐ์ค์น์ ์ธ์ฝ๋ฉ๋ฉ๋๋ค.
ํ์ต ํ ์ ๋ ฌ โ ์ผ๋ฐ์ ์ผ๋ก ์ธ๊ฐ ํผ๋๋ฐฑ ๊ฐํ ํ์ต(RLHF) ๋๋ ๊ทธ ๋ณํ(RLAIF, DPO) โ ์ ๋ชจ๋ธ์ ์ ์ฉํ ์ด์์คํดํธ๋ก ๋ง๋ค์ด ์ค๋๋ค. ์ธ๊ฐ ํ๊ฐ์๊ฐ ์ ์ฉ์ฑ, ๋ฌดํด์ฑ, ์ ์ง์ฑ์ ๊ธฐ์ค์ผ๋ก ์ถ๋ ฅ์ ํ๊ฐํฉ๋๋ค. ๊ทธ ํ๊ฐ๋ฅผ ๋ฐํ์ผ๋ก ๋ณด์ ๋ชจ๋ธ์ด ํ์ต๋๊ณ , ๊ธฐ๋ฐ LLM์ ๋ณด์์ ์ต๋ํํ๋๋ก ํ์ธํ๋๋ฉ๋๋ค. RLHF๋ ๊ฑฐ์ ํ๋, ์ด์กฐ, ์์ ๊ฐ์ด๋๋ผ์ธ์ ๊ฒฐ์ ํ๋ฉฐ โ ๊ธฐ๋ณธ ์ํคํ ์ฒ๊ฐ ์๋๋๋ค.
- ์ฌ์ ํ์ต: ์น ๊ท๋ชจ ๋ฐ์ดํฐ์ ๋ํ ๋น์ง๋ ๋ค์ ํ ํฐ ์์ธก. ์ธ์ด ํจํด, ์ธ๊ณ ์ง์, ์ถ๋ก ๋จ์ถํค๋ฅผ ๋ชจ๋ธ ๊ฐ์ค์น์ ์ธ์ฝ๋ฉํฉ๋๋ค(์ต์ ๋ชจ๋ธ์ ๊ฒฝ์ฐ ์ฝ 70Bโ405B ํ๋ผ๋ฏธํฐ).
- ์ง๋ ํ์ธํ๋(SFT): ์์ ํ ์คํธ ์์ธก๊ธฐ๊ฐ ์๋ ์ด์์คํดํธ์ฒ๋ผ ํ๋ํ๋๋ก ์ ๋ณ๋ ์ง์-์๋ต ์์ผ๋ก ๋ชจ๋ธ์ ํ์ตํฉ๋๋ค.
- RLHF / DPO: ์ธ๊ฐ์ ์ ํธ๋๊ฐ ๋ชจ๋ธ์ ์ ์ฉํ๊ณ ๋ฌดํดํ๋ฉฐ ์ ์งํ ์ถ๋ ฅ์ผ๋ก ์ด๋๋๋ค. DPO(์ง์ ์ ํธ๋ ์ต์ ํ)๋ Llama ๋ฐ Mistral ๋ชจ๋ธ์ด ์ฌ์ฉํ๋ ๋ ๊ณ์ฐ ํจ์จ์ ์ธ ๋์์ ๋๋ค.
- Constitutional AI (Anthropic): Claude๋ ์ฃ์ง ์ผ์ด์ค์์ ์ธ๊ฐ ํผ๋๋ฐฑ์ ๋ํ ์์กด๋๋ฅผ ์ค์ด๊ธฐ ์ํด ์์น ์งํฉ("ํ๋ฒ")์ ์ฌ์ฉํ์ฌ ์ถ๊ฐ๋ก ํ์ต๋ฉ๋๋ค โ Claude Opus 4.8์ด ์ด ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.
์ถ๋ก ์๋ ๋ฐฉ์: ์ํ๋ง๊ณผ ๋์ฝ๋ฉ
์ถ๋ก ์ค์ ๋ชจ๋ธ์ ํ ํฐ ๋จ์๋ก ์ถ๋ ฅ์ ์์ฑํฉ๋๋ค โ ์ ์ฒด ์ดํ์ ๋ํ ํ๋ฅ ๋ถํฌ๋ฅผ ๊ณ์ฐํ๊ณ ์ฌ์ฉ์๊ฐ ์ ์ดํ๋ ๋์ฝ๋ฉ ๋งค๊ฐ๋ณ์์ ๋ฐ๋ผ ์ํ๋งํฉ๋๋ค. ๊ฐ์ฅ ์ค์ํ ์ธ ๊ฐ์ง ๋งค๊ฐ๋ณ์๋ ์จ๋, top-p(ํต ์ํ๋ง), ์ต๋ ํ ํฐ ์์ ๋๋ค.
| ๋งค๊ฐ๋ณ์ | ๋ฒ์ | ํจ๊ณผ | ์ต์ ์ฉ๋ |
|---|---|---|---|
| ์จ๋ | 0.0 โ 2.0 | ํ๋ฅ ๋ถํฌ๋ฅผ ๋ ์นด๋กญ๊ฒ(๋ฎ์) ๋๋ ํํํ๊ฒ(๋์) ๋ง๋ฆ | ์ฝ๋/์ฌ์ค์๋ 0; ๊ธ์ฐ๊ธฐ์๋ 0.7; ์ฐฝ์์ ๊ณผ์ ์๋ 1.0 |
| Top-p (ํต) | 0.0 โ 1.0 | ๋์ ํ๋ฅ ์ด p์ ๋๋ฌํ๋ ํ ํฐ์ผ๋ก ์ํ๋ง์ ์ ํ | ๋๋ถ๋ถ์ ๊ณผ์ ์๋ 0.9โ0.95; ์ ์ฝ๋ ์ถ๋ ฅ์๋ 0.5 |
| Top-k | 1 โ ์ดํ ํฌ๊ธฐ | ๋ค์์ผ๋ก ๊ฐ์ฅ ํ๋ฅ ๋์ k๊ฐ์ ํ ํฐ์ผ๋ก ์ํ๋ง์ ์ ํ | ๋ ์ฌ์ฉ๋จ; top-p๊ฐ ์ผ๋ฐ์ ์ผ๋ก ์ ํธ๋จ |
| ์ต๋ ํ ํฐ ์ | 1 โ ์ปจํ ์คํธ ํ๊ณ | ์ถ๋ ฅ ๊ธธ์ด์ ํ๋ ์ ์ง | ์๋ฆผ์ ๋ฐฉ์งํ๋ ค๋ฉด ์์ ์ถ๋ ฅ ๊ธธ์ด์ 2๋ฐฐ๋ก ์ค์ |
| ๋น๋ ํจ๋ํฐ | -2.0 โ 2.0 | ์ด๋ฏธ ์์ฑ๋ ํ ํฐ์ ๋ฐ๋ณต์ ์ค์ | ๊ธด ๋ฌธ์์๋ 0.1โ0.3; ์ฝ๋์๋ 0 |
์ปจํ ์คํธ ์๋์ฐ: ๋ชจ๋ธ์ด ๋ณผ ์ ์๋ ๊ฒ
์ปจํ ์คํธ ์๋์ฐ๋ ๋ชจ๋ธ์ด ๋จ์ผ ์ถ๋ก ํธ์ถ์์ ์ฒ๋ฆฌํ ์ ์๋ ์ต๋ ํ ํฐ ์์ ๋๋ค โ ์์คํ ํ๋กฌํํธ, ๋ํ ๊ธฐ๋ก, ๋ฌธ์, ํ์ฌ ์ฌ์ฉ์ ๋ฉ์์ง๋ฅผ ๋ชจ๋ ํฉํ ๊ฒ์ ๋๋ค.** ์ธ์ ๊ฐ์๋ ์๋ฌด๊ฒ๋ ์ ์ง๋์ง ์์ผ๋ฉฐ, ๋ชจ๋ธ์ ๋งค๋ฒ ์๋กญ๊ฒ ์์ํฉ๋๋ค.
์ปจํ ์คํธ ์๋์ฐ ํฌ๊ธฐ๋ ๋ชจ๋ธ์ ๋ฐ๋ผ ํฌ๊ฒ ๋ค๋ฅด๋ฉฐ, ์ด๋ค ์ฌ์ฉ ์ฌ๋ก๊ฐ ์ค์ฉ์ ์ธ์ง์ ์ง์ ์ ์ผ๋ก ์ํฅ์ ๋ฏธ์นฉ๋๋ค:
| ๋ชจ๋ธ | ์ปจํ ์คํธ ์๋์ฐ | ๋๋ต์ ์ธ ๋จ์ด ์ ํ์ฐ | ์ค์ฉ์ ์ธ ๋ฌธ์ ํ๊ณ |
|---|---|---|---|
| GPT-5.5 (OpenAI) | 128,000 ํ ํฐ | ์ฝ 96,000๋จ์ด | ์ฝ 200ํ์ด์ง PDF |
| Claude Opus 4.8 (Anthropic) | 200,000 ํ ํฐ | ์ฝ 150,000๋จ์ด | ์ฝ 300ํ์ด์ง PDF |
| Gemini 3.1 Pro (Google DeepMind) | 2,000,000 ํ ํฐ | ์ฝ 1,500,000๋จ์ด | ์ฝ 3,000ํ์ด์ง PDF |
| LLaMA 3.1 70B (Meta, Ollama ๊ฒฝ์ ) | 128,000 ํ ํฐ | ์ฝ 96,000๋จ์ด | ์ฝ 200ํ์ด์ง PDF |
ํ๋กฌํํธ ์์ง๋์ด๋ง์ ๋ํ ์์ฌ์
LLM ์ํคํ ์ฒ๋ฅผ ์ดํดํ๋ฉด ํ๋กฌํํธ ํ์ง์ด ์ง์ ์ ์ผ๋ก ํฅ์๋ฉ๋๋ค โ ํ ํฐ ์์น, ์จ๋, ์ปจํ ์คํธ ์๋์ฐ ํ์ฉ๋, ์ถ๋ ฅ ๊ธธ์ด๋ ๋ชจ๋ ์ถ๋ ฅ ์ ๋ขฐ์ฑ์ ์ธก์ ๊ฐ๋ฅํ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
- ์ค์ํ ์ง์์ฌํญ์ ์ฒ์์ ๋ฐฐ์นํ์ญ์์ค. ์์คํ ํ๋กฌํํธ๋ ๋ชจ๋ ์ฌ์ฉ์ ๋ฉ์์ง๋ณด๋ค ๋จผ์ ์ฒ๋ฆฌ๋ฉ๋๋ค. ๊ธด ํ๋กฌํํธ ์ค๊ฐ์ ๋ฌปํ ์๋ ์ง์์ฌํญ์ "์ค๊ฐ ์์ค" ํจ๊ณผ๋ก ์ธํด ๊ฐ์ค์น๊ฐ ๋ฎ์์ง๋๋ค. ์ ์ฝ ์กฐ๊ฑด๊ณผ ์ญํ ์ ์๋ ์์คํ ํ๋กฌํํธ์ ๋ฐฐ์นํ์ญ์์ค.
- ์จ๋๋ ์ด์ง ์ค์์น๊ฐ ์๋ ์กฐ์ ๋ค์ด์ผ์ ๋๋ค. ์ฝ๋ ์์ฑ๊ณผ ์ฌ์ค ๊ธฐ๋ฐ ๊ณผ์ ์๋ ์จ๋ 0์ ์ฌ์ฉํ์ญ์์ค. ์ฝํ ์ธ ์์ฑ์๋ 0.5โ0.7์ ์ฌ์ฉํ์ญ์์ค. 1.0 ์ด๊ณผ๋ ๋ค์์ฑ์ ๋์ด์ง๋ง ํ๊ฐ ์ํ๋ ํฌ๊ฒ ์ฆ๊ฐํฉ๋๋ค.
- ํ ํฐ ์๋ ๋น์ฉ๊ณผ ์ง์ฐ ์๊ฐ์ ์ ํ์ ์ผ๋ก ์ํฅ์ ๋ฏธ์นฉ๋๋ค. API ๊ฐ๊ฒฉ์ ํ ํฐ๋น(์ ๋ ฅ ๋ฐ ์ถ๋ ฅ) ์ฑ ์ ๋ฉ๋๋ค. ์ผ์ผ ์ฌ์ฉ์ 100๋ช ์ 10,000 ํ ํฐ ์์คํ ํ๋กฌํํธ๋ ์ ๋ ฅ๋ง์ผ๋ก๋ ํ๋ฃจ 100๋ง ํ ํฐ์ ๋น์ฉ์ด ๋ฐ์ํฉ๋๋ค โ ์ง์์ฌํญ์ ์ฒ ์ ํ๊ฒ ์์ถํ์ญ์์ค.
- ๋ชจ๋ธ์ ์์ ์ด ํ๋ ธ๋ค๋ ๊ฒ์ "์์ง" ๋ชปํฉ๋๋ค. ํ๊ฐ์ ํ ํฐ ์์ธก์ ๊ตฌ์กฐ์ ํน์ฑ์ ๋๋ค โ ๋ชจ๋ธ์ ๊ฒ์ฆ๋ ์ ๋ณด๊ฐ ์๋ ํต๊ณ์ ์ผ๋ก ํ๋ฅ ์ด ๋์ ๊ฒ์ ์ถ๋ ฅํฉ๋๋ค. ์ค์ํ ์์ฉ ํ๋ก๊ทธ๋จ์์๋ ํญ์ ์ฌ์ค ์ฃผ์ฅ์ ๊ฒ์ฆํ์ญ์์ค.
- ์ปจํ ์คํธ ์๋์ฐ โ ์ดํ ์ ํ์ง. 200,000 ํ ํฐ ์ปจํ ์คํธ ์๋์ฐ๊ฐ ๋ชจ๋ธ์ด ๋ชจ๋ 200,000 ํ ํฐ์ ๋๋ฑํ๊ฒ ์ฃผ์๋ฅผ ๊ธฐ์ธ์ธ๋ค๋ ์๋ฏธ๋ ์๋๋๋ค. ์ฝ 50,000 ํ ํฐ์ ์ด๊ณผํ๋ ๋ฌธ์์ ๊ฒฝ์ฐ ์ ์ฒด ์ปจํ ์คํธ ์ฑ์ฐ๊ธฐ ๋์ RAG๋ฅผ ์ด์ฉํ ์ฒญํน์ ๊ณ ๋ คํ์ญ์์ค.
LLM์ ๋ํ ์ผ๋ฐ์ ์ธ ์คํด
LLM์ ๊ดํ ์ด๋ฌํ ์คํด๋ค์ ์๋ชป ์ค๊ณ๋ ํ๋กฌํํธ์ ์๋ชป๋ ๊ธฐ๋๋ก ์ด์ด์ง๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค:
| ์คํด | ์ค์ ๋ก ์ผ์ด๋๋ ์ผ | ํ๋กฌํํธ ์์ง๋์ด๋ง์ ๋ํ ์์ฌ์ |
|---|---|---|
| "๋ชจ๋ธ์ด ๋ด ๋ฌธ์๋ฅผ ์ฝ๊ณ ์ดํดํ๋ค" | ๋ชจ๋ธ์ ํ ํฐ ์ํ์ค๋ฅผ ์ฒ๋ฆฌํ๊ณ ์ฐ์์ ์์ธกํฉ๋๋ค โ ๋ ํด๊ฐ ์ด๋ฃจ์ด์ง์ง ์์ต๋๋ค | ์ถ์ถํ๊ณ ์ ํ๋ ๊ฒ์ ๋ช ์์ ์ผ๋ก ์ง์ ํ์ญ์์ค; ๋ชจ๋ธ์ด ๋ชฉํ๋ฅผ ์ถ๋ก ํ๋ค๊ณ ๊ฐ์ ํ์ง ๋ง์ญ์์ค |
| "๋ชจ๋ธ์ด ์ง๋ ๋ํ๋ฅผ ๊ธฐ์ตํ๋ค" | ๊ฐ API ํธ์ถ์ ๋ฌด์ํ์ ๋๋ค; ๊ธฐ๋ก์ ์ปจํ ์คํธ ์๋์ฐ์ ๋ช ์์ ์ผ๋ก ํฌํจํด์ผ ํฉ๋๋ค | ๊ด๋ จ ์ด์ ์ปจํ ์คํธ๋ฅผ ์์คํ ํ๋กฌํํธ ๋๋ ๋ํ ๊ธฐ๋ก์ ํฌํจ์ํค์ญ์์ค |
| "๋ชจ๋ธ์ด ํ์ฌ ๋ ์ง๋ฅผ ์๋ค" | ๋ชจ๋ธ์๋ ํ์ต ์ข ๋ฃ์ผ์ด ์์ผ๋ฉฐ ์๋ ค์ฃผ์ง ์์ผ๋ฉด ์ค๋ ๋ ์ง๋ฅผ ๋ชจ๋ฆ ๋๋ค | ๋ ์ง์ ๋ฏผ๊ฐํ ๊ณผ์ ์ ๊ฒฝ์ฐ ์์คํ ํ๋กฌํํธ์ ํ์ฌ ๋ ์ง๋ฅผ ์ฃผ์ ํ์ญ์์ค |
| "์จ๋๊ฐ ๋์์๋ก ๋ ๋๋ํ ์ถ๋ ฅ์ด ๋์จ๋ค" | ์จ๋๋ ๋ฅ๋ ฅ์ด๋ ์ ํ๋๊ฐ ์๋ ์ํ๋ง ๋ฌด์์์ฑ์ ์ ์ดํฉ๋๋ค | ๋ถ์ ๊ณผ์ ์๋ ๋ฎ์ ์จ๋(0.0โ0.3)๋ฅผ ์ฌ์ฉํ์ญ์์ค; ์ฐฝ์์ ๋ณํ์๋ ๋์ ์จ๋๋ฅผ ์ฌ์ฉํ์ญ์์ค |
| "๋ชจ๋ธ์ด ๋ฌธ์ ์๋ฅผ ์์ ์ ์ผ๋ก ์ ์ ์๋ค" | ํ ํฐ ๊ฒฝ๊ณ๋ ์๋ธ์๋ ๋จ์์ ๋๋ค; ์ ํํ ๋ฌธ์ ๋๋ ๋จ์ด ๊ณ์ฐ์ ๊ธฐ๋ณธ ๊ธฐ๋ฅ์ด ์๋๋๋ค | ์ ํํ ๋จ์ด ์ธ๊ธฐ๋ฅผ ๋ชจ๋ธ์ ์์กดํ์ง ๋ง์ญ์์ค; ํ์ฒ๋ฆฌ ๋๋ ์ฝ๋๋ฅผ ์ฌ์ฉํ์ญ์์ค |
PromptQuorum์์ ์ฌ๋ฌ ๋ชจ๋ธ์ ์จ๋ ํจ๊ณผ ํ ์คํธ
PromptQuorum์์ ํ ์คํธํ ๊ฒฐ๊ณผ โ GPT-5.5, Claude Opus 4.8, Gemini 3.1 Pro์ ๋์ผํ ์ฐฝ์์ ๋ธ๋ฆฌํ๋ฅผ ์จ๋ 0๊ณผ ์จ๋ 0.9์์ ๊ฐ๊ฐ ์ ์กํ์ ๋, Claude Opus 4.8์ด ์จ๋ ๊ฐ ์ถ๋ ฅ ํธ์ฐจ๊ฐ ๊ฐ์ฅ ์๊ณ Gemini 3.1 Pro๊ฐ ๊ฐ์ฅ ํฌ๋ค๋ ๊ฒ์ด ๋ํ๋ฌ์ต๋๋ค. ์จ๋ 0.9์์ Gemini 3.1 Pro๋ ์จ๋ 0 ๋๋น ํ๊ท 34% ๋ ๊ธด ์ถ๋ ฅ์ ์์ฑํ์ต๋๋ค.
PromptQuorum์ ๋ฉํฐ ๋ชจ๋ธ ๋์คํจ์น๋ฅผ ์ฌ์ฉํ๋ฉด ์ง์ ๋ ์จ๋์์ ๋ชจ๋ ์ฌ์ฉ ๊ฐ๋ฅํ ๋ชจ๋ธ์ ๋์์ ํ๋กฌํํธ๋ฅผ ์คํํ๊ณ ์ถ๋ ฅ์ ๋๋ํ ๋น๊ตํ ์ ์์ต๋๋ค โ ๋ชจ๋ธ ๊ธฐ๋ณธ๊ฐ์ ์์กดํ๋ ๋์ ํน์ ๊ณผ์ ์ ๋ง๋ ์จ๋ ์ค์ ์ ์ค์ฉ์ ์ผ๋ก ์กฐ์ ํ ์ ์์ต๋๋ค.
์ง์ญ๋ณ LLM ์ํคํ ์ฒ ์ฐจ์ด
LLM์ ์ํคํ ์ฒ์ ์ฑ๋ฅ์ ํ์ต ๋ฐ์ดํฐ ๊ตฌ์ฑ, ํ ํฌ๋์ด์ ์ด์ ์ ๋ต, ๊ท์ ์ ์ฝ ๋ฑ์ ๋ฐ๋ผ ์ง์ญ๋ณ๋ก ํฌ๊ฒ ๋ค๋ฆ ๋๋ค. ์ด๋ฌํ ์ฐจ์ด๋ฅผ ์ดํดํ๋ ๊ฒ์ ๋ชจ๋ธ์ ์ ์ธ๊ณ์ ์ผ๋ก ๋ฐฐํฌํ๋ ํ์๊ฒ ๋งค์ฐ ์ค์ํฉ๋๋ค.
Qwen 3์ CJK(์ค๊ตญ์ด, ์ผ๋ณธ์ด, ํ๊ตญ์ด) ์คํฌ๋ฆฝํธ์ ๋ํ ๋ฐ์ด๋ ํ ํฌ๋์ด์ ์ด์ ํจ์จ์ฑ์ ๋ฌ์ฑํฉ๋๋ค** โ ๋ง๋ค๋ฆฐ ์ค๊ตญ์ด์์ ๋ฌธ์๋น ์ฝ 0.3 ํ ํฐ์ ์ฌ์ฉํ๋ ๋ฐ๋ฉด GPT-5.5๋ ๋ฌธ์๋น 0.5 ํ ํฐ์ ์ฌ์ฉํฉ๋๋ค. ์ด 40% ํ ํฐ ๊ฐ์๋ ์์์ ์ธ์ด ์ ํ๋ฆฌ์ผ์ด์ ์ API ๋น์ฉ๊ณผ ์ง์ฐ ์๊ฐ์ ์ง์ ์ ์ผ๋ก ์ค์ฌ ์ค๋๋ค. Qwen์ ํ์ต ๋ฐ์ดํฐ๋ 20%๊ฐ CJK ์ฝํ ์ธ ๋ก ๊ตฌ์ฑ๋์ด ์์ด, ๋ฌธ์ ๋ ์๋ฏธ ๋ฐ๋๊ฐ ๊ฐ์ฅ ๋์ ์คํฌ๋ฆฝํธ์ ๋ง๊ฒ ํ ํฌ๋์ด์ ๋ฅผ ์ต์ ํํฉ๋๋ค.
Mistral Small๊ณผ Mistral Large๋ ์ ๋ฝ ๋ฐฐํฌ๋ฅผ ์ํด ๋ช ์์ ์ผ๋ก ์ค๊ณ๋์์ผ๋ฉฐ, ํ์ต ๋ฐ์ดํฐ๋ GDPR, ํ๋์ค AI ๋ฒ, ๋ฐ์ดํฐ ๋ณด์กด ๋ฐ ๋ชจ๋ธ ํฌ๋ช ์ฑ์ ๊ดํ EU ๊ท์ ์ ์ค์ํ๋๋ก ํํฐ๋ง๋์์ต๋๋ค. ํํฐ๋ง๋์ง ์์ ์น ๋ฐ์ดํฐ๋ฅผ ์ฃผ๋ก ํ์ต์ ์ฌ์ฉํ๋ ๋ชจ๋ธ๊ณผ ๋ฌ๋ฆฌ, Mistral์ ๋ฐ์ดํฐ ์ถ์ฒ๋ฅผ ๋ฌธ์ํํ๊ณ EU ์๋ฏผ์ ๊ฐ์ธ ์ ๋ณด๋ฅผ ํ์ต์์ ์ ์ธ์์ผ, ์ ๋ฝ์ ๊ท์ ์ฐ์ (์ํ, ์๋ฃ, ๋ฒ๋ฅ ๊ธฐ์ )์์ ๊ธฐ๋ณธ ์ ํ์ง๊ฐ ๋์์ต๋๋ค.
DeepSeek์ ์ํคํ ์ฒ๋ ํ์ต ๊ตฌ์ฑ์ ๋ฐ์ํฉ๋๋ค: ์ฌ์ ํ์ต ๋ฐ์ดํฐ์ 70%๊ฐ ์ค๊ตญ์ด์ ์์ด, 15%๊ฐ ์ฝ๋, 15%๊ฐ ๊ธฐํ ์ธ์ด์ ๋๋ค. ์ด ๋น์จ์ ์ค๊ตญ์ด ์ธ์ด ์ ์ฐฝ์ฑ๊ณผ ์ฝ๋ ์์ฑ ์๋์ ํธํฅ๋ ๋ชจ๋ธ์ ๋ง๋ค์ด ๋ด๋ฉฐ, ์ ์์ ์ธ์ด์์๋ ์ฑ๋ฅ์ด ํฌ๊ฒ ๋จ์ด์ง๋๋ค. ํ ํฐ ๋ถํฌ์ ์ดํ ์ ํจํด์ ์์ด๊ฐ ์๋ ๋ง๋ค๋ฆฐ ์ค๊ตญ์ด์ ๋น๋ ํจํด์ ์ต์ ํ๋์ด ์์ต๋๋ค.
๊ด๋ จ ์ฝ์๊ฑฐ๋ฆฌ
- ๊ธฐ์ด: ํ๋กฌํํธ ์์ง๋์ด๋ง์ด๋? โ LLM ์ํคํ ์ฒ ์ง์์ ์ฒด๊ณ์ ์ธ ํ๋กฌํํธ ์ค๊ณ์ ์ ์ฉํ๋ ๋ฐฉ๋ฒ
- ๊ธฐ์ด: ์ปจํ ์คํธ ์๋์ฐ ์ค๋ช โ AI๊ฐ ์๋ ์ด์ โ ์ปจํ ์คํธ ์๋์ฐ ํ๊ณ์ ๊ฒ์ ์ ๋ต์ ๋ํ ์ฌ์ธต ๋ถ์
- ๊ธฐ์ด: ํ ํฐ, ๋น์ฉ, ํ๊ณ: AI ํ๋กฌํํ ์ ๊ฒฝ์ ํ โ ํ ํฐ ๊ฐ๊ฒฉ ์ฑ ์ , ์์ฒญ ํ๋, GPT-5.5, Claude, Gemini ์ ๋ฐ์ ๋น์ฉ ์ต์ ํ
- ๊ธฐ์ด: AI ํ๊ฐ ์ค๋ช โ LLM์ด ์ ๋ณด๋ฅผ ๊พธ๋ฉฐ๋ด๋ ์ด์ โ ํ ํฐ ์์ธก๊ณผ ์ฌ์ค ๊ฒ์ ๋ถ์ฌ๊ฐ ์ด๋ป๊ฒ ์ ๋ขฐ๋ ์ค๋ฅ๋ก ์ด์ด์ง๋์ง
- AI ํ๊ณ: LLM์ด ํ ์ ์๋ ๊ฒ๋ค โ ๋ชจ๋ LLM์ด ๊ณต์ ํ๋ 8๊ฐ์ง ๊ตฌ์กฐ์ ์ ์ฝ๊ณผ ๊ฐ๊ฐ์ ๋ํ ์์ง๋์ด๋ง ํด๊ฒฐ์ฑ
LLM ์๋ ๋ฐฉ์ ์ดํดํ๋ ๋ฒ
- 1ํ ํฐ๋ถํฐ ์์ํ์ญ์์ค: LLM์ด ๊ธ์๋ ๋จ์ด๊ฐ ์๋ ํ ํฐ(์๋ธ์๋ ๋จ์)์ ๋ณด๋ฉฐ, ์์ด์์๋ ์ผ๋ฐ์ ์ผ๋ก ๋จ์ด๋น 1โ2 ํ ํฐ์์ ์ดํดํ์ญ์์ค. ์จ๋ผ์ธ ํ ํฌ๋์ด์ (OpenAI ๋๋ Anthropic ์ ๊ณต)๋ฅผ ์ฌ์ฉํ์ฌ ์ํ ํ ์คํธ์ ํ ํฐ์ ์ธ์ด ๋ณด์ญ์์ค. "ChatGPT"๊ฐ ์ด๋ป๊ฒ "Chat" + "G" + "PT"๋ก ๋ถํ ๋๋์ง, ๊ทธ๋ฆฌ๊ณ ์ด๊ฒ์ด ๊ฐ๊ฒฉ ์ฑ ์ ๊ณผ ์ปจํ ์คํธ ์๋์ฐ์ ์ด๋ค ์ํฅ์ ๋ฏธ์น๋์ง ํ์ธํ์ญ์์ค.
- 2ํธ๋์คํฌ๋จธ ์ํคํ ์ฒ์ ์ธ ๊ฐ์ง ํต์ฌ ๋ ์ด์ด๋ฅผ ํ์ตํ์ญ์์ค: ์๋ฒ ๋ฉ, ์ดํ ์ , ์ถ๋ ฅ ํ๋ก์ ์ . ์ง์ ๊ตฌํํ ํ์๋ ์์ง๋ง ๊ฐ๋ ์ ์ผ๋ก ์ดํดํ์ญ์์ค: ์๋ฒ ๋ฉ์ ํ ํฐ์ ๋ฒกํฐ๋ก ๋ณํํ๊ณ , ์ดํ ์ ์ ๋ชจ๋ ํ ํฐ ์์ ๋น๊ตํ์ฌ ๊ด๊ณ๋ฅผ ํ์ ํ๋ฉฐ, ์ถ๋ ฅ ํ๋ก์ ์ ์ ๋ค์ ์ดํ๋ก ๋งคํํฉ๋๋ค. ์ด๊ฒ์ด LLM์ด ๋งฅ๋ฝ์ ์ดํดํ๋ ์ด์ ์ ํ๊ฐ์ ์ผ์ผํค๋ ์ด์ ๋ฅผ ์ค๋ช ํฉ๋๋ค.
- 3LLM์ด ํ๊ฐ์ ์ผ์ผํค๋ ์ด์ ๋ฅผ ์ดํดํ์ญ์์ค: "์ฌ๋ฐ๋ฅธ ์ฌ์ค"์ด ์๋ ํ์ต ๋ฐ์ดํฐ ํจํด์ ๊ธฐ๋ฐ์ผ๋ก "ํ๋ฅ ์ ์ผ๋ก ๊ทธ๋ด๋ฏํ ๋ค์ ํ ํฐ"์ ์์ธกํฉ๋๋ค. ํ์ต ๋ฐ์ดํฐ์ ํน์ ์ฃผ์ ์ ๋ํ ์์ถฉ๋๊ฑฐ๋ ๋ถ์กฑํ ์ ๋ณด๊ฐ ์์ผ๋ฉด ๋ชจ๋ธ์ ์ต์ ์ ์ถ์ธก์ด ํ๋ฆด ์๋ ์์ต๋๋ค. ์ด๋ ์์ ๊ฐ๋ฅํ ๋ฒ๊ทธ๊ฐ ์๋ ๊ทผ๋ณธ์ ์ธ ํน์ฑ์ ๋๋ค. ์ฌ์ค ๊ธฐ๋ฐ ๊ณผ์ ์๋ ์จ๋(T)๋ฅผ ๋ฎ๊ฒ, ์ฐฝ์์ ์ธ ๊ณผ์ ์๋ ๋๊ฒ ์ค์ ํ์ญ์์ค.
- 4์จ๋์ top-p๋ฅผ ์คํํ์ฌ ์ถ๋ ฅ์ด ์ด๋ป๊ฒ ๋ณํ๋์ง ํ์ธํ์ญ์์ค. T=0.0(๊ฒฐ์ ๋ก ์ ), T=0.7(๋ค์ํ์ง๋ง ์ผ๊ด์ฑ ์์), T=1.5(๋ฌด์์)์์ ํ ์คํธ๋ฅผ ์์ฑํ์ญ์์ค. ๋ ๋์ T = ๋ ๋ง์ ๋ณํ์์ ํ์ธํ์ญ์์ค. top-p(ํต ์ํ๋ง)์ด ํ๋ฅ ์ด ๋ฎ์ ํ ํฐ์ ํํฐ๋งํ์ฌ ์๋ฏธ ์๋ ์ถ๋ ฅ์ ์ค์ธ๋ค๋ ๊ฒ์ ์ดํดํ์ญ์์ค.
- 5์ปจํ ์คํธ ์๋์ฐ๋ฅผ ์ดํดํ์ญ์์ค: ๋ชจ๋ธ์ ์ต๊ทผ ํ ํฐ์ ๊ณ ์ ๋ ์๋์ฐ๋ง "๋ด ๋๋ค". GPT-5.5์ 128k ํ ํฐ ์๋์ฐ๋ ์ฝ 96,000๋จ์ด์ ํด๋นํฉ๋๋ค. ์ค๋๋ ์ ๋ณด๋ ์๋์ฐ ๋ฐ์ผ๋ก ๋ฒ์ด๋๊ธฐ ๋๋ฌธ์ "์ํ์ง๋๋ค". ์ด๊ฒ์ด LLM์ด ๊ธด ๋ํ์์ ์ด์ ์ ๋ณด์ ๋ชจ์๋๋ ๋ฐ์ธ์ ํ๋ ์ด์ ๋ฅผ ์ค๋ช ํฉ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
LLM์ ์ธ๊ฐ์ฒ๋ผ ํ ์คํธ๋ฅผ ์ดํดํฉ๋๊น?
์๋๋๋ค. LLM์ ์ธ๊ฐ์ ์๋ฏธ์์ ํ ์คํธ๋ฅผ ์ดํดํ์ง ์์ต๋๋ค. ํ์ต ์ค ํ์ต๋ ํจํด์ ๊ธฐ๋ฐ์ผ๋ก ์ด์ ํ ํฐ์ ๊ณ ๋ คํ์ฌ ํต๊ณ์ ์ผ๋ก ๊ฐ์ฅ ํ๋ฅ ์ด ๋์ ๋ค์ ํ ํฐ์ ์์ธกํฉ๋๋ค. ์ดํด, ์๋, ์์์ ์์ต๋๋ค โ ์ฝ 50,000โ100,000๊ฐ ํ ํฐ์ ์ดํ์ ๋ํ ๊ฐ์ค๋ ํ๋ฅ ๋ถํฌ๋ง ์์ ๋ฟ์ ๋๋ค.
LLM์์ ํ ํฐ์ด๋ ๋ฌด์์ ๋๊น?
ํ ํฐ์ LLM์ด ์ฒ๋ฆฌํ๋ ๊ฐ์ฅ ์์ ๋จ์์ ๋๋ค โ ์์ด์์๋ ์ฝ ๋จ์ด 0.75๊ฐ, ์ค๊ตญ์ด๋ ์ผ๋ณธ์ด์์๋ ์ฝ 0.5๊ฐ์ ํด๋นํฉ๋๋ค. ๋จ์ด, ์๋ธ์๋, ๊ตฌ๋์ , ๊ณต๋ฐฑ์ด ๋ชจ๋ ํ ํฐ์ด ๋ฉ๋๋ค. GPT-5.5๋ BPE(Byte Pair Encoding)๋ฅผ ์ฌ์ฉํ์ฌ ์ฒ๋ฆฌ ์ ์ ํ ์คํธ๋ฅผ ํ ํฐ์ผ๋ก ๋ถํ ํฉ๋๋ค. 1,000๋จ์ด ๋ฌธ์๋ ์์ด๋ก ์ฝ 1,300๊ฐ์ ํ ํฐ์ด ๋ฉ๋๋ค.
LLM์์ ์จ๋๋ ๋ฌด์์ ํฉ๋๊น?
์จ๋๋ ๋ชจ๋ธ์ด ํ๋ฅ ๋ถํฌ์์ ์ผ๋ง๋ ๋ฌด์์๋ก ์ํ๋งํ๋์ง๋ฅผ ์ ์ดํฉ๋๋ค. ์จ๋ 0์ ํญ์ ๊ฐ์ฅ ๋์ ํ๋ฅ ์ ๋ค์ ํ ํฐ์ ์ ํํฉ๋๋ค(๊ฒฐ์ ๋ก ์ ). ์จ๋ 1.0์ ๋ถํฌ์์ ๋น๋ก์ ์ผ๋ก ์ํ๋งํฉ๋๋ค. 1.5 ์ด๊ณผ๋ ๋ถํฌ๋ฅผ ํํํ๊ฒ ๋ง๋ค๊ณ ํ๊ฐ ์ํ์ ๋์ ๋๋ค. ๋๋ถ๋ถ์ ํ๋ก๋์ ์ฌ์ฉ ์ฌ๋ก์์๋ 0.1์์ 0.7 ์ฌ์ด๊ฐ ๊ฐ์ฅ ํจ๊ณผ์ ์ ๋๋ค.
ํ๋กฌํํธ์์ ์ ๋ณด์ ์์น๊ฐ ์ ์ค์ํฉ๋๊น?
ํธ๋์คํฌ๋จธ ์ดํ ์ ์ ์ปจํ ์คํธ ์๋์ฐ์ ์์๊ณผ ๋ ๊ทผ์ฒ์ ํ ํฐ์ ์ค๊ฐ ํ ํฐ๋ณด๋ค ๋ ๋์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ๋ ๊ฒฝํฅ์ด ์์ต๋๋ค โ Liu et al.(2023)์ด ๋ฌธ์ํํ "์ค๊ฐ ์์ค" ํจํด์ ๋๋ค. ์ฝ 2,000 ํ ํฐ์ ์ด๊ณผํ๋ ํ๋กฌํํธ์ ๊ฒฝ์ฐ ๊ฐ์ฅ ์ค์ํ ์ง์์ฌํญ์ ์ฒ์์ ๋ฐฐ์นํ๊ณ ํต์ฌ ์ ์ฝ ์กฐ๊ฑด์ ๋์ ๋ฐ๋ณตํ์ญ์์ค.
RLHF๋ ๋ฌด์์ด๋ฉฐ ๋ชจ๋ธ ์ถ๋ ฅ์ ์ด๋ค ์ํฅ์ ๋ฏธ์นฉ๋๊น?
์ธ๊ฐ ํผ๋๋ฐฑ ๊ฐํ ํ์ต(RLHF)์ ์ธ๊ฐ ํ๊ฐ์๊ฐ ๋ชจ๋ธ ์ถ๋ ฅ์ ์ฑ์ ํ๊ณ ๊ทธ ์ฑ์ ์ ๊ธฐ๋ฐ์ผ๋ก ๋ณด์ ๋ชจ๋ธ์ด ํ์ต๋๋ ํ์ต ํ ๋จ๊ณ์ ๋๋ค. ๊ธฐ๋ฐ LLM์ ๋ณด์์ ์ต๋ํํ๋๋ก ํ์ธํ๋๋ฉ๋๋ค. RLHF๋ ๊ฑฐ์ , ์ด์กฐ, ์ ์ฉ์ฑ, ์์ ํ๋์ ํ์ฑํฉ๋๋ค โ ์ด๊ฒ์ด ์๋ก ๋ค๋ฅธ ์ฐ๊ตฌ์์ ๋ชจ๋ธ์ด ์ ์ฌํ ๋ฒค์น๋งํฌ ์ ์์๋ ๋ถ๊ตฌํ๊ณ ๋์ผํ ํ๋กฌํํธ์์ ๋ค๋ฅด๊ฒ ํ๋ํ๋ ์ด์ ์ ๋๋ค.
์ปจํ ์คํธ ์๋์ฐ์ ๋ฉ๋ชจ๋ฆฌ์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
์ปจํ ์คํธ ์๋์ฐ๋ ๋จ์ผ ์ถ๋ก ํธ์ถ ์ค์ ๋ชจ๋ธ์ด ๋ณผ ์ ์๋ ๋ชจ๋ ํ ์คํธ์ ๋๋ค โ ์์คํ ํ๋กฌํํธ, ๊ธฐ๋ก, ํ์ฌ ๋ฉ์์ง๋ฅผ ํฌํจํฉ๋๋ค. ์ง์์ ์ธ ๋ฉ๋ชจ๋ฆฌ๊ฐ ์๋๋๋ค: ๋ํ๊ฐ ๋๋๋ฉด ๋ชจ๋ธ์ ์๋ฌด๊ฒ๋ ์ ์งํ์ง ์์ต๋๋ค. GPT-5.5: 128,000 ํ ํฐ. Claude Opus 4.8: 200,000 ํ ํฐ. Gemini 3.1 Pro: 2,000,000 ํ ํฐ.
"์ค๊ฐ ์์ค" ํจ๊ณผ๋ ๋ฌด์์ด๋ฉฐ ์ด๋ป๊ฒ ํผํ ์ ์์ต๋๊น?
Stanford University์ Liu et al.(2023)์ด ๋ฌธ์ํํ "์ค๊ฐ ์์ค" ํจ๊ณผ๋ ํธ๋์คํฌ๋จธ ์ดํ ์ ์ด ๊ธด ์ปจํ ์คํธ ์ค๊ฐ์ ์ ๋ณด๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๊ณผ์ ํ๊ฐํ๋ค๋ ๊ฒ์ ๋ณด์ฌ ์ค๋๋ค. ์ด๋ฅผ ํผํ๋ ค๋ฉด: ์ค์ํ ์ง์์ฌํญ์ ์์คํ ํ๋กฌํํธ(์ฒ์)์ ๋ฐฐ์นํ๊ณ , ์ ๋ ฅ์ ์ฒ์ 10โ15%์ ์ค์ํ ์ปจํ ์คํธ๋ฅผ ์ ์งํ๋ฉฐ, ์ฌ์ฉ์ ๋ฉ์์ง ๋์ ๊ฐ์ฅ ์ค์ํ ์ ์ฝ ์กฐ๊ฑด์ ๋ฐ๋ณตํ์ญ์์ค. ์ฝ 50,000 ํ ํฐ์ ์ด๊ณผํ๋ ๋ฌธ์์๋ ์ ์ฒด ์ปจํ ์คํธ ์ฑ์ฐ๊ธฐ ๋์ RAG๋ฅผ ์ฌ์ฉํ์ญ์์ค.
RLHF์ Constitutional AI์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
RLHF(์ธ๊ฐ ํผ๋๋ฐฑ ๊ฐํ ํ์ต)๋ ์ธ๊ฐ ํ๊ฐ์๊ฐ ์ถ๋ ฅ์ ์ฑ์ ํ๊ณ , ๋ณด์ ๋ชจ๋ธ์ ํ์ตํ๋ฉฐ, LLM์ ํ์ธํ๋ํ์ฌ ๋ณด์์ ์ต๋ํํ๋ ํ์ต ํ ๊ธฐ๋ฒ์ ๋๋ค. Constitutional AI(Anthropic์ด Claude์ ์ฌ์ฉ)๋ ๋ชจ๋ ์ฃ์ง ์ผ์ด์ค์ ๋ํ ์ธ๊ฐ ํผ๋๋ฐฑ ์์ด ํ๋์ ์๋ดํ๋ ์๋ฉด ์์น ์งํฉ("ํ๋ฒ")์ ์ถ๊ฐํจ์ผ๋ก์จ RLHF๋ฅผ ํ์ฅํฉ๋๋ค. ์ด๋ ์ผ๊ด๋ ๊ฐ์น ์ ๋ ฌ์ ์ ์งํ๋ฉด์ ์ธ๊ฐ ํ๊ฐ์์ ๋ํ ์์กด๋๋ฅผ ์ค์ฌ ์ค๋๋ค.
GPT-5.5, Claude, Gemini์ ์ํคํ ์ฒ์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
์ธ ๋ชจ๋ธ ๋ชจ๋ ํธ๋์คํฌ๋จธ ๊ธฐ๋ฐ LLM์ด์ง๋ง ๊ท๋ชจ์ ํ์ต ํ ์ฒ๋ฆฌ์์ ์ฐจ์ด๊ฐ ์์ต๋๋ค. GPT-5.5(OpenAI): 128,000 ํ ํฐ ์ปจํ ์คํธ, ์ถ๋ก ์ ๋ฐ์ด๋จ. Claude Opus 4.8(Anthropic): 200,000 ํ ํฐ, ์ ๋ ฌ์ ์ํด Constitutional AI ์ฌ์ฉ. Gemini 3.1 Pro(Google DeepMind): ์ด์ฅ๋ฌธ ๋ฌธ์ ์ฒ๋ฆฌ๋ฅผ ์ํ 2,000,000 ํ ํฐ. ์ด๋ฌํ ์ฐจ์ด๋ ๋น์ฉ, ์ง์ฐ ์๊ฐ, ๋ค์ํ ๊ณผ์ ์ ๋ํ ์ ํฉ์ฑ์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
1,000๋จ์ด ํ ์คํธ์ ํ ํฐ ์๋ ๋ช ๊ฐ์ ๋๊น?
์์ด์์ 1,000๋จ์ด โ 1,300โ1,350 ํ ํฐ์ ๋๋ค. ๋๋ต 1 ํ ํฐ = 0.75๋จ์ด์ ๋๋ค. ์ค๊ตญ์ด๋ ์ผ๋ณธ์ด์ ๊ฒฝ์ฐ 1 ํ ํฐ โ 0.5๋จ์ด๋ฅผ ์ฌ์ฉํ์ญ์์ค โ ์ค๊ตญ์ด/์ผ๋ณธ์ด 1,000๋จ์ด โ 2,000 ํ ํฐ์ ๋๋ค. ํ ํฐ ์๋ API ๋น์ฉ๊ณผ ์ปจํ ์คํธ ์๋์ฐ ์๋น์ ์ง์ ์ ์ผ๋ก ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
์จ๋์ top-p์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
์จ๋๋ ์ ์ฒด ํ๋ฅ ๋ถํฌ๋ฅผ ๋ ์นด๋กญ๊ฒ ํ๊ฑฐ๋ ํํํ๊ฒ ํฉ๋๋ค โ ์จ๋ 0 = ๊ฒฐ์ ๋ก ์ , ์จ๋ 1.0 = ํ์ค, ์จ๋ 2.0 = ๋งค์ฐ ๋ฌด์์์ . Top-p(ํต ์ํ๋ง)๋ ์ํ๋ง์ ๋์ ํ๋ฅ ์ด p์ ๋๋ฌํ๋ ๊ฐ์ฅ ์์ ํ ํฐ ์งํฉ์ผ๋ก ์ ํํฉ๋๋ค โ top-p 0.9๋ "ํ๋ฅ ์ง๋์ 90%๋ฅผ ๊ตฌ์ฑํ๋ ํ ํฐ์์ ์ํ๋ง"์ ์๋ฏธํฉ๋๋ค. ๋๋ถ๋ถ์ ๊ณผ์ ์์๋ ์จ๋๊ฐ ์๋ top-p(0.8โ0.95)๋ฅผ ์กฐ์ ํ์ญ์์ค; ์จ๋๋ ์ฐฝ์์ฑ ์ ์ด๋ฅผ ์ํด ๊ฐ์ฅ ํจ๊ณผ์ ์ ๋๋ค.
์ถ์ฒ ๋ฐ ์ถ๊ฐ ์ฝ์๊ฑฐ๋ฆฌ
- Vaswani et al., 2017. "Attention Is All You Need" โ ๋ชจ๋ ํ๋ LLM์ ๊ธฐ๋ฐ์ด ๋๋ ์ ํ ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์๊ฐํ ์๋ณธ ํธ๋์คํฌ๋จธ ๋ ผ๋ฌธ
- Liu et al., 2023. "Lost in the Middle: How Language Models Use Long Contexts" โ ์ฅ๋ฌธ ์ปจํ ์คํธ LLM์์ ์์น ์์กด์ ์ดํ ์ ํธํฅ์ ๋ฌธ์ํํ Stanford ์ฐ๊ตฌ
- Ouyang et al., 2022. "Training language models to follow instructions with human feedback" โ GPT-3์ RLHF๋ฅผ ๋์ ํ InstructGPT ๋ ผ๋ฌธ, ChatGPT ๋ฐ ํ๋ ์ ๋ ฌ๋ LLM์ ๊ธฐ๋ฐ
- OpenAI. ํ ํฌ๋์ด์ ๋ฌธ์ โ ํ ํฐ ๊ณ์ฐ ๋ฐ GPT ๋ชจ๋ธ์ฉ ํ ์คํธ ์ธ์ฝ๋ฉ ๋ฐฉ๋ฒ์ ๋ํ ๋ํํ ๊ฐ์ด๋
- Touvron et al., 2023. "Llama 3.3: Open Foundation and Fine-Tuned Chat Models" โ Llama 3.3 ์ํคํ ์ฒ, ํ์ต ํ์ดํ๋ผ์ธ, ์ง์ ํ๋ ๋ฐฉ๋ฒ๋ก ์ ๊ดํ Meta์ ํฌ๊ด์ ์ธ ๋ ผ๋ฌธ
- Anthropic. Constitutional AI: Harmlessness from AI Feedback โ ์์ RLHF์ ๋์์ผ๋ก ๋ชจ๋ธ ํ๋์ ์๋ดํ๊ธฐ ์ํด "ํ๋ฒ"์ ์ฌ์ฉํ๋ ๊ฒ์ ๊ดํ Anthropic ์ฐ๊ตฌ
- HuggingFace. Tokenizers Library & Summary โ ํ๋ LLM์์ ์ฌ์ฉ๋๋ BPE, WordPiece, SentencePiece ๋ฐ ๊ธฐํ ํ ํฌ๋์ด์ ์ด์ ์๊ณ ๋ฆฌ์ฆ์ ๋ํ ๊ธฐ์ ์ ์ฌ์ธต ๋ถ์
- Google DeepMind. Gemini 3.5 Technical Report โ 100๋ง ํ ํฐ ์ปจํ ์คํธ ์๋์ฐ๋ฅผ ๊ฐ์ง ์ต์ ๋ชจ๋ธ์ ์ํคํ ์ฒ ๋ฐ ์ฑ๋ฅ ๋ถ์
- EleutherAI. GPT-NeoX-20B: An Open-Source Autoregressive Language Model โ ์คํ ์์ค ๋ชจ๋ธ ํ์ต ๋ฌธ์ํ ๋ฐ ๋๊ท๋ชจ LLM ๊ฐ๋ฐ์ ์ํคํ ์ฒ ์ ํ ๋ถ์
- OpenAI. Improving Language Models by Segmenting, Attending, and Predicting with Structured State Space Models โ ํจ์จ์ ์ธ ์ฅ๋ฌธ ์ปจํ ์คํธ ์ฒ๋ฆฌ๋ฅผ ์ํ ์์ ํธ๋์คํฌ๋จธ ์ดํ ์ ์ ๋์์ ๊ดํ ์ฐ๊ตฌ