๋น ๋ฅธ ์ฌ์ค
- 46% โ CommonCrawl ํ์ต ๋ฐ์ดํฐ ์ค ์์ด ๋น์ค. ์ค๊ตญ์ด๋ ์ฝ 3%, ํ๋์ค์ด๋ ์ฝ 5%, ๋ ์ผ์ด๋ ์ฝ 6%์ ๋ถ๊ณผํฉ๋๋ค.
- 1,900ํ ํฐ โ ์๋์ด๋ก 1,000๋จ์ด ํํ ์ ํ์ํ ํ ํฐ ์(์์ด ๋๋น 46% ๋ ๋ง์). 900ํ ํฐ โ ์ค๊ตญ์ด(์์ด ๋๋น 31% ์ ์).
- 5โ12% โ ์์ด ์ฐ์ ์ฌ๊ณ ์ถ๋ก ๊ณผ ์์ด๋ฏผ ์ธ์ด ์ถ๋ ฅ์ ์กฐํฉํ์ฌ ์ฌ์ฉํ ๋์ ์ ํ๋ ํฅ์(3๋จ๊ณ ์ธ์ด).
- 15โ20% โ ์์ด ํจ์ท ์์๋ฅผ ๋น์์ด ์์ ์ ์ฌ์ฉํ ๋์ ์ ํ๋ ์ ํ(Shi et al., 2023).
- Mistral Large 2๋ ๋ก๋ง์ค ์ธ์ด์์ ์ฐ์, Gemini 3.0 Pro๋ ๋์์์ ์ธ์ด์์ ์ฐ์, GPT-5.5๋ ์๋์ด์์ ์ฐ์ํฉ๋๋ค.
์ธ์ด๊ฐ ์๊ฐ๋ณด๋ค ์ค์ํ ์ด์
๐ฌ In Plain Terms
์ด๋ ๊ฒ ์๊ฐํด ๋ณด์ญ์์ค. LLM์ ์์ญ์ต ๊ถ์ ์ฑ , ์น์ฌ์ดํธ, ๊ธฐ์ฌ๋ฅผ ํตํด ์์ด๋ฅผ ๋ฐฐ์ ๊ณ , ์๋ฐฑ๋ง ๊ฐ์ ์๋ฃ๋ฅผ ํตํด ํ๋์ค์ด๋ฅผ ๋ฐฐ์ ์ต๋๋ค. ํ๋์ค์ด๋ก ์ง๋ฌธํ๋ฉด ๋ชจ๋ธ์ด ์ฐธ์กฐํ ์ ์๋ ์์๊ฐ ๋ ์ ๊ธฐ ๋๋ฌธ์ ๋ ๋ง์ ์ค์๋ฅผ ํฉ๋๋ค. ์ด๋ ํ์ ์ฌ์ฉํด์จ ์ธ์ด์ ๋ช ์ฃผ๋ง ๊ณต๋ถํ ์ธ์ด๋ก ์ํ ๋ฌธ์ ๋ฅผ ํธ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
๋ค๊ตญ์ด ํ๋กฌํํ ์ ๋ฒ์ญ์ด ์๋๋๋ค. ๋ชจ๋ธ์ด ํ์ตํ ๋ถํฌ์ ๋ค๋ฅธ ์์ญ์ ํ์ฑํํ๋ ๊ฒ์ ๋๋ค. LLM์ ํ ์คํธ๋ฅผ ๊ณต์ ์๋ฒ ๋ฉ ๊ณต๊ฐ์์ ํ ํฌ๋์ด์ฆํ๊ณ ํํํ์ง๋ง, ํ์ต ๋ฐ์ดํฐ๋ ํธํฅ๋์ด ์์ต๋๋ค. ๋๋ถ๋ถ์ LLM ํ์ต์ ์ฌ์ฉ๋ CommonCrawl์ ์ฝ 46%๊ฐ ์์ด, ์ฝ 6%๊ฐ ๋ ์ผ์ด, ์ฝ 5%๊ฐ ํ๋์ค์ด, ์ฝ 3%๊ฐ ์ค๊ตญ์ด์ ๋๋ค. ํ์ต ๋ฐ์ดํฐ ๋น์ค์ด 1% ๋ฏธ๋ง์ธ ์ธ์ด(์: ๋๋ถ๋ถ์ ์ํ๋ฆฌ์นด ์ธ์ด, ๋ง์ ๋จ์์์ ์ธ์ด)๋ ์์ธก ๋ถ๊ฐ๋ฅํ๊ฒ ์๋ํฉ๋๋ค.
ํ๋์ค์ด๋ก ํ๋กฌํํ ํ๋ฉด ๋ชจ๋ธ์ ํ๋์ค์ด ํ์ต ๋ฐ์ดํฐ์์ ๋์จ ํจํด์ ์์กดํฉ๋๋ค. ํ๋์ค์ด ๋ฐ์ดํฐ๋ ํ์ต ์ฝํผ์ค์ ์ฝ 5%์ ๋ถ๊ณผํ๋ฏ๋ก, ์์ด ํ๋กฌํํธ์ ๋นํด ๋ชจ๋ธ์ด ํ์ฉํ ์ ์๋ ํ์ต๋ ์ฐ๊ด์ฑ์ด ๋ ์ ์ต๋๋ค. ์ด๋ ์ถ๋ก ์ ํ๋ ์ ํ, ์ง์ ์ดํ ๋ถ์ผ์น, ๋์ ํ๊ฐ๋ฅ , ์์ธก ๋ถ๊ฐ๋ฅํ ์ถ๋ ฅ ํ์ง๋ก ๋ํ๋ฉ๋๋ค.
LLM์ด ์ค์ ๋ก ์ธ์ด ํจํด์ ํ์ตํ๋ ๋ฐฉ๋ฒ์ ๋ ์์ธํ ์์๋ณด๋ ค๋ฉด LLM์ด ์ค์ ๋ก ์๋ํ๋ ๋ฐฉ์์ ์ฐธ์กฐํ์ญ์์ค.
4๋จ๊ณ ์ธ์ด ๋ชจ๋ธ
๐ In One Sentence
ํ์ต ๋ฐ์ดํฐ ๋น์ค์ด ๋์์๋ก ํ์ต๋ ํจํด์ด ๋ง์์ง๊ณ ์ถ๋ ฅ์ด ๋ ์ ๋ขฐํ ์ ์์ต๋๋ค. 1๋จ๊ณ(์์ด)๋ ์ฝ 46%, 2๋จ๊ณ(์ ๋ฝ์ด)๋ ์ฝ 5โ8%, 3๋จ๊ณ(์์์์ด/์๋์ด)๋ ์ฝ 2โ4%, 4๋จ๊ณ(<1%)๋ ๊ฒ์ ์ฆ๊ฐ ์์ฑ์ด ํ์ํฉ๋๋ค.
LLM์์ ์ธ์ด ์ฑ๋ฅ์ ํ์ต ๋ฐ์ดํฐ ๋น์ค์ ๋ฐ๋ผ 4๋จ๊ณ ๊ณ์ธต ๊ตฌ์กฐ๋ฅผ ๋ฐ๋ฆ ๋๋ค. 1๋จ๊ณ(์์ด)๋ ๊ฑฐ์ ์๋ฒฝํ๊ฒ ์ํ๋๊ณ , 4๋จ๊ณ(์ ์์ ์ธ์ด)๋ ์ ๋ขฐํ ์ ์๋ ์ถ๋ ฅ์ ์์ฑํฉ๋๋ค. ๋จ๊ณ ์์คํ ์ ์ฌ์ฉํ์ฌ ๋์ ์ธ์ด์ ์ด๋ค ์ ๋ต์ ์ ์ฉํ ์ง ๊ฒฐ์ ํ์ญ์์ค.
| ๋จ๊ณ | ์ธ์ด | ํ์ต ๋ฐ์ดํฐ ๋น์ค(๊ทผ์ฌ) | ๊ถ์ฅ ์ ๋ต |
|---|---|---|---|
| 1๋จ๊ณ | ์์ด | ~46% | ์ง์ ํ๋กฌํํ , ๋ชจ๋ ๊ธฐ๋ฒ ์ ์ฉ ๊ฐ๋ฅ |
| 2๋จ๊ณ | ํ๋์ค์ด, ๋ ์ผ์ด, ์คํ์ธ์ด, ํฌ๋ฅดํฌ๊ฐ์ด, ์ดํ๋ฆฌ์์ด | ๊ฐ 5โ8% | ์์ด๋ฏผ ์ธ์ด ์ฌ์ฉ์ ํ๋กฌํํธ, ๊ตฌ์กฐ์ฉ ์์ด ์์คํ ํ๋กฌํํธ |
| 3๋จ๊ณ | ์ค๊ตญ์ด, ์ผ๋ณธ์ด, ํ๊ตญ์ด, ์๋์ด, ๋ฌ์์์ด | ๊ฐ 2โ4% | ์์ด CoT + ์์ด๋ฏผ ์ธ์ด ์ถ๋ ฅ, ์ถ๋ ฅ ๊ฒฐ๊ณผ ์ฒ ์ ํ ํ ์คํธ |
| 4๋จ๊ณ | ๊ทธ ์ธ ๋๋ถ๋ถ์ ์ธ์ด | <1% | ์ฌ์ ๊ฒ์ฆ๋ ์ฝํ ์ธ ๋ก RAG ์ฌ์ฉ, ์ธ๊ฐ ๊ฒํ ์์ด ์์ฑํ ์ถ๋ ฅ ์ง์ |
์คํฌ๋ฆฝํธ๋ณ ํ ํฐ ๋น์ฉ
๋์ผํ 1,000๋จ์ด ์ฝํ ์ธ ๊ฐ ์๋์ด๋ก๋ ์์ด๋ณด๋ค ํ ํฐ์ด 46% ๋ ๋ง์ด ์์๋๊ณ , ์ผ๋ณธ์ด๋ก๋ 30% ๋ ๋ง์ด ์์๋์ด API ๋น์ฉ์ด ์ง์ ์ ์ผ๋ก ์ฆ๊ฐํฉ๋๋ค. ํ ํฐ ํจ์จ์ ์คํฌ๋ฆฝํธ์ ์ธ์ด๊ตฐ์ ๋ฐ๋ผ ํฌ๊ฒ ๋ค๋ฆ ๋๋ค. ์ด๋ API ๋น์ฉ๊ณผ ์ปจํ ์คํธ ์๋์ฐ ์์ฐ ๋ชจ๋์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
๋ค๊ตญ์ด ์ํฌํ๋ก์ฐ์์ ํ ํฐ ์์ฐ์ ํธ์ฑํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์์ธํ ๋ด์ฉ์ ํ ํฐ, ๋น์ฉ ๋ฐ ํ๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
| ์ธ์ด | ์คํฌ๋ฆฝํธ | ํ ํฐ(๊ทผ์ฌ) | ์์ด ๋๋น | API ๋น์ฉ ๋ฐฐ์ |
|---|---|---|---|---|
| ์์ด | Latin | ~1,300 | ๊ธฐ์ค | 1.0ร |
| ๋ ์ผ์ด | Latin | ~1,500 | +15% | 1.15ร |
| ํ๋์ค์ด | Latin | ~1,450 | +12% | 1.12ร |
| ์คํ์ธ์ด | Latin | ~1,400 | +8% | 1.08ร |
| ๋ฌ์์์ด | Cyrillic | ~1,700 | +31% | 1.31ร |
| ์ค๊ตญ์ด(๊ฐ์ฒด) | CJK | ~900 | โ31% | 0.69ร |
| ์ผ๋ณธ์ด | CJK + kana | ~1,100 | โ15% | 0.85ร |
| ํ๊ตญ์ด | Hangul | ~1,400 | +8% | 1.08ร |
| ์๋์ด | Arabic | ~1,900 | +46% | 1.46ร |
์์คํ ํ๋กฌํํธ๋ ์์ด๋ก ์์ฑํด์ผ ํฉ๋๊น, ๋์ ์ธ์ด๋ก ์์ฑํด์ผ ํฉ๋๊น?
๊ตฌ์กฐํ ๋ฐ ์ถ๋ก ์์ ์ ๊ฒฝ์ฐ, ์์ด ์์คํ ํ๋กฌํํธ๊ฐ 2โ3๋จ๊ณ ์ธ์ด์์ ์์ด๋ฏผ ์ธ์ด ์์คํ ํ๋กฌํํธ๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค. ์ด์กฐ์ ๊ฒฉ์ ํํ์ ๊ดํด์๋ ์์ด๋ฏผ ์ธ์ด ์์คํ ํ๋กฌํํธ๊ฐ ๋ ์ฐ์ํฉ๋๋ค. ์ด๊ฒ์ด ๋ค๊ตญ์ด ํ๋กฌํํ ์์ ๊ฐ์ฅ ์ค์ํ ๊ฒฐ์ ์ฌํญ์ ๋๋ค. ์๋ชป ์ ํํ๋ฉด ์ถ๋ ฅ ํ์ง์ด ์ ํ๋ฉ๋๋ค.
์ด์ ๊ฐ ๋ฌด์์ ๋๊น? LLM์ ์ง์ ์ดํ ๋ฅ๋ ฅ ๋๋ถ๋ถ์ ์์ด RLHF(์ธ๊ฐ ํผ๋๋ฐฑ ๊ฐํ ํ์ต) ๋ฐ์ดํฐ๋ก ํ์ต๋์์ต๋๋ค. ๋ณต์กํ ์์คํ ์์ค ์ง์นจ(์์ ๊ท์น, ํ๋ฅด์๋, ์ฐ์ ์ฌ๊ณ ์ง์)์ ์์ด๋ก ์์ฑ๋ ๋ ๋ ์์ ์ ์ผ๋ก ์ดํ๋ฉ๋๋ค. ์์ด ์ง์นจ์ ๋ชจ๋ธ์ ํต์ฌ ์ถ๋ก ๊ฒฝ๋ก์ ์ผ๋ถ์ ๋๋ค.
๊ทธ๋ฌ๋ ์คํ์ผ ์ง์นจ(๊ฒฉ์ ์์ค, ๋ฌธํ์ ์ด์กฐ, ์์ ์์ค)์ ๋์ ์ธ์ด๋ก ์์ฑํ๋ ๊ฒ์ด ๊ฐ์ฅ ์ข์ต๋๋ค. "๊ฒฉ์์ฒด ํ๋์ค์ด"๋ "์ ์คํ ์ผ๋ณธ์ด"๊ฐ ์ค์ ๋ก ์ด๋ค ์๋ฏธ์ธ์ง์ ๋ํ ์์ด๋ฏผ์ ๊ธฐ๋๋ฅผ ์ดํดํ๋ ๋ฐ ์์กดํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
์์ฌ๊ฒฐ์ ํธ๋ฆฌ: ๋ณต์กํ ์ถ๋ก /์์ ๊ท์น โ ์์ด ์์คํ ํ๋กฌํํธ. ๊ฒฉ์ ์์ค(Sie, Vous, ๊ฒฝ์ด) โ ๋์ ์ธ์ด. ํ๋ฅด์๋ ์ ์ โ ์์ด + ๋์ ์ธ์ด ์ํ ํ๋. ์ถ๋ ฅ ์ธ์ด ๋ช ์ โ ํญ์ ์์คํ ํ๋กฌํํธ์ ๋ช ์: "Respond in formal Japanese (ไธๅฏง่ช / ใงใใปใพใไฝ)."
์์ธํ ๋ด์ฉ์ ์์คํ ํ๋กฌํํธ vs. ์ฌ์ฉ์ ํ๋กฌํํธ๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
โ ์์คํ ํ๋กฌํํธ๋ฅผ ์ ๋ถ ๋ ์ผ์ด๋ก ์์ฑ: "Du bist ein Kundensupport-Assistent. Antworte auf Deutsch."
Why it hurts: ๋ณต์กํ ์ง์นจ(์ค๋ฅ ์ฒ๋ฆฌ, ๊ตฌ์กฐ, ๋ ผ๋ฆฌ)์ด ๋ฒ์ญ ๊ณผ์ ์์ ์์ค๋ฉ๋๋ค. ์ ์์ ์ธ์ด์์ ๋ชจ๋ธ์ด ์์ ๊ท์น์ ๋ฐ๋ฅด๋ ๋ฐ ์ด๋ ค์์ ๊ฒช์ต๋๋ค.
Fix: ์์คํ ์ง์นจ์๋ ์์ด๋ฅผ ์ฌ์ฉํ์ญ์์ค: "You are a customer support assistant. Respond in German using formal Sie-form." ๊ทธ๋ฐ ๋ค์ ๋ ์ผ์ด๋ก ์ด์กฐ/๊ฒฉ์ ์ง์นจ์ ํฌํจํ์ญ์์ค.
โ ๏ธ ํํ ์ค์
์์คํ ํ๋กฌํํธ์ ์ฌ์ฉ์ ์ง์นจ ๋ชจ๋๋ฅผ ๋์ ์ธ์ด๋ก ์์ฑํ๋ฉด ์ถ๋ก ์ ํ๋๊ฐ ์ ํ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ ผ๋ฆฌ์๋ ์์ด๋ฅผ, ์ด์กฐ์๋ ๋์ ์ธ์ด๋ฅผ ์ฌ์ฉํ์ญ์์ค.
๐ก ํ๋ก ํ
๋ ๊ฐ์ง ์ ๊ทผ ๋ฐฉ์(์์ด ์์คํ + ์์ด ์ถ๋ก vs. ์์ด ์์คํ + ์์ด๋ฏผ ์ถ๋ก )์ ์ฌ์ฉ์์ ์ค์ ์ฌ์ฉ ์ฌ๋ก์์ ํ ์คํธํด ๋ณด์ญ์์ค. ๋ชจ๋ธ ๋์์ ์ธ์ด ๋จ๊ณ์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค.
๋์ ์ vs. ์ข์ ์: ๋ค๊ตญ์ด ์์คํ ํ๋กฌํํธ
๋์ ํ๋กฌํํธ โ ๋ชจ๋ธ์ด ์ธ์ด์ ๊ฒฉ์ ์์ค์ ์๋ ๊ฐ์งํ ๊ฒ์ด๋ผ๊ณ ๊ฐ์ :
"์ด ๋ ์ผ์ด ๊ณ์ฝ์๋ฅผ ์์ฝํด ์ฃผ์ธ์."
๊ฒฐ๊ณผ: ์์ด์ ๋ ์ผ์ด๊ฐ ํผํฉ๋ ์ถ๋ ฅ, ๋น๊ฒฉ์ ์ด์กฐ, ๋ฒ์ ์ ๋ฌธ ์ฉ์ด ๋๋ฝ ๊ฐ๋ฅ์ฑ.
์ข์ ํ๋กฌํํธ โ ์ธ์ด, ๊ฒฉ์ ์์ค, ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ๋ช ์์ ์ผ๋ก ์ง์ :
"๋น์ ์ ๋ฒ๋ฅ ๋ถ์๊ฐ์ ๋๋ค. ๋ค์ ๋ฌธ์๋ ๋ ์ผ ๊ทผ๋ก๊ณ์ฝ์(Arbeitsvertrag)์ ๋๋ค. ๊ณต์ ๋ ์ผ์ด(Sie-Form)๋ก ์ฃผ์ ์๋ฌด ์ฌํญ์ ์์ฝํ์ญ์์ค. ๊ตฌ์กฐ: Vertragsparteien, Vergรผtung, Kรผndigungsfristen, Besondere Klauseln. ์ต๋ 200 ๋จ์ด. ํ์ค ๋ ์ผ ๊ณ ์ฉ๋ฒ์ ๋นํด ๋น์ ์์ ์ธ ์กฐํญ์ PRรFEN์ผ๋ก ํ์ํ์ญ์์ค."
๊ฒฐ๊ณผ: ๋๋ฉ์ธ์ ์ ํฉํ ์ฉ์ด์ ์ด์ ์กฐํญ ํ์๊ฐ ํฌํจ๋ ๊ตฌ์กฐํ๋ ๊ฒฉ์์ฒด ๋ ์ผ์ด ์ถ๋ ฅ.
์ด๋ค ๋ชจ๋ธ์ด ์ด๋ค ์ธ์ด์ ๊ฐ์ฅ ์ ํฉํฉ๋๊น?
๋ชจ๋ ์ธ์ด์์ ์ฐ์ํ ๋จ์ผ ๋ชจ๋ธ์ ์์ต๋๋ค. Mistral Large 2๋ ๋ก๋ง์ค ์ธ์ด์์, Google Gemini 3.0 Pro๋ ๋์์์ ์ธ์ด์์, GPT-5.5๋ ์๋์ด์ ๋ค๊ตญ์ด ์ถ๋ก ์์ ์์ ๊ฐ์ฅ ์ฐ์ํฉ๋๋ค. ์ด ํ๋ Ahuja et al.(2023) MEGA ๋ฒค์น๋งํฌ์์ ๋ชจ๋ธ ์ฑ๋ฅ์ ์ง๊ณํ ๊ฒ์ ๋๋ค.
| ๋ชจ๋ธ | 2๋จ๊ณ(์ ๋ฝ์ด) | 3๋จ๊ณ(๋์์์์ด) | ์๋์ด | ์ต์ ์ฌ์ฉ ์ฌ๋ก |
|---|---|---|---|---|
| GPT-5.5 | โ ๊ฐํจ | โ ๊ฐํจ | โ ์ต์ฐ์ | ์ผ๋ฐ ๋ค๊ตญ์ด, ๊ตฌ์กฐํ ์ถ์ถ |
| Claude Opus 4.8 | โ ๊ฐํจ | โ ์ํธ | โ ์ํธ | ๋ฌธ์ ๋ถ์, ์ธ๋ฐํ ์ด์กฐ |
| Gemini 3.0 Pro | โ ์ํธ | โ ์ต์ฐ์ | โ ์ํธ | ์ผ๋ณธ์ด/ํ๊ตญ์ด/์ค๊ตญ์ด, ๋ฒ์ญ |
| Mistral Large 2 | โ ์ต์ฐ์ | โ ๋ณดํต | โ ๋ณดํต | ํ๋์ค์ด/์คํ์ธ์ด/์ดํ๋ฆฌ์์ด ๋น์ฆ๋์ค ์ฝํ ์ธ |
| Qwen 3 72B | โ ๋ณดํต | โ ๊ฐํจ | โ ์ํธ | ์ค๊ตญ์ด ์ฐ์ ์ํฌํ๋ก์ฐ(์คํ์์ค) |
| Llama 3.3 70B | โ ์ํธ | โ ๋ณดํต | โ ๋ณดํต | ์ ๋ฝ ์ธ์ด, ๋น์ฉ ํจ์จ์ ์ธ ์ต์ |
๐ก ํ๋ก ํ
PromptQuorum์ ์ฌ์ฉํ์ฌ ๋์ผํ ํ๋กฌํํธ๋ฅผ 6๊ฐ ๋ชจ๋ธ์์ ๋์์ ํ ์คํธํด ๋ณด์ญ์์ค. ๋๋ํ ๋น๊ตํ๋ฉด ์ด๋ ๋ชจ๋ธ์ด ์ฌ์ฉ์์ ์ธ์ด ๋ฐ ์์ ์กฐํฉ์ ๊ฐ์ฅ ์ ํฉํ์ง ํ์ ํ ์ ์์ต๋๋ค.
๐ ์๊ณ ๊ณ์ จ์ต๋๊น?
๋ชจ๋ธ ์ฑ๋ฅ์ ์ธ์ด๋ฟ๋ง ์๋๋ผ ๋๋ฉ์ธ์ ๋ฐ๋ผ์๋ ๋ค๋ฆ ๋๋ค. ์ผ๋ณธ์ด ๊ธฐ์ ๋ฒ์ญ์์ ํ์ํ ๋ชจ๋ธ์ด ์ผ๋ณธ์ด ๊ณ ๊ฐ ์๋น์ค ์ด์กฐ์์๋ ์ฑ๋ฅ์ด ์ ํ๋ ์ ์์ต๋๋ค.
์ฌ์ฉ ์ฌ๋ก๋ณ ๋น์ฉ
์์ ํ ํฐ ๋น์ฉ ์ฐจ์ด๋ API ๋น์ฉ์ ์ง์ ๋ฐ์๋ฉ๋๋ค. GPT-5.5 ์๊ธ(์ ๋ ฅ ํ ํฐ 100๋ง ๊ฐ๋น $5)์ ๊ธฐ์ค์ผ๋ก ํ ์ค์ ์ํฅ์ ๋๋ค.
| ์ฌ์ฉ ์ฌ๋ก | ์์ด ๋น์ฉ | ์๋์ด ๋น์ฉ | ์ผ๋ณธ์ด ๋น์ฉ | ์ ์ฝ ํ |
|---|---|---|---|---|
| ํ๋ฃจ 100๊ฑด์ ๊ณ ๊ฐ ์ด๋ฉ์ผ | $X | $1.46X | $0.85X | ์ผ๋ณธ์ด์๋ Gemini 3.0 Pro ์ฌ์ฉ, ์๋์ด๋ 46% ์ถ๊ฐ ์์ฐ ์ฑ ์ |
| 10,000๋จ์ด ๋ณด๊ณ ์ ์์ฝ | $Y | $1.46Y | $0.85Y | ์์ด๋ก ์ฒญํน ํ ๋์ ์ธ์ด๋ก ์ถ๋ ฅ |
| 500๊ฐ์ ์ ํ ์ค๋ช | $Z | $1.46Z | $0.85Z | ์ค๊ตญ์ด๊ฐ ๊ฐ์ฅ ์ ๋ ด(0.69ร) |
์ธ์ด ๊ฐ ์ฐ์ ์ฌ๊ณ ํ๋กฌํํ
3๋จ๊ณ ์ธ์ด์ ๊ฒฝ์ฐ, ์ฐ์ ์ฌ๊ณ ์ง์นจ์ ์์ด๋ก ์์ฑํ๋ ์ต์ข ๋ต๋ณ์ ๋์ ์ธ์ด๋ก ์์ฒญํ๋ฉด ์ถ๋ก ์ ํ๋๊ฐ 5โ12% ํฅ์๋ฉ๋๋ค(Shi et al., 2023). ์ด ๊ต์ฐจ ์ธ์ด CoT ๊ธฐ๋ฒ์ ๋ชจ๋ธ์ ์์ด ์ถ๋ก ๊ฐ์ ์ ํ์ฉํ๋ฉด์ ๋์ ์ธ์ด์ ์ถ๋ ฅ ํ์ง์ ์ ์งํฉ๋๋ค.
LLM์ด ๋จ๊ณ๋ณ๋ก ์ถ๋ก ํ ๋ ๊ฐ์ฅ ํฐ ํ์ต ์ฝํผ์ค(์์ด)์ ํจํด์ ์์กดํฉ๋๋ค. ์ผ๋ณธ์ด๋ ์๋์ด์ ๊ฐ์ ์ ์์ ์ธ์ด์์ ์ ์ ์ผ๋ก ์ถ๋ก ์ด ์ด๋ฃจ์ด์ง๋๋ก ๊ฐ์ ํ๋ฉด, ํด๋น ์ธ์ด์์ ํ์ต๋ ์ถ๋ก ํจํด์ด ๋ ์ ๊ธฐ ๋๋ฌธ์ ์ ํ๋๊ฐ ๋จ์ด์ง๋๋ค. ์์ด CoT์ ์์ด๋ฏผ ์ธ์ด ์ถ๋ ฅ์ ์กฐํฉํ๋ ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ ๋ฐฉ์์ด ์ต์ ์ ๋๋ค.
ํ ํ๋ฆฟ: `Think through this step by step in English, then write your final answer in Japanese. Question: question`
๊ฒฐ์ ๊ธฐ์ค: ๋ค๋จ๊ณ ์ถ๋ก ์ด ํ์ํ ๊ฒฝ์ฐ, ๋์ ์ธ์ด๊ฐ 3๋จ๊ณ ์ด์์ธ ๊ฒฝ์ฐ, ์ง์ฐ ์๊ฐ๋ณด๋ค ์ ํ๋๊ฐ ์ค์ํ ๊ฒฝ์ฐ โ ์์ด CoT ์ฌ์ฉ. ์ถ๋ก ๊น์ด๋ณด๋ค ์ด์กฐ์ ๊ฒฉ์์ด ์ค์ํ ๊ฒฝ์ฐ, ๋์ ์ธ์ด๊ฐ 1โ2๋จ๊ณ์ธ ๊ฒฝ์ฐ โ ์์ด๋ฏผ ์ธ์ด CoT ์ฌ์ฉ.
์ฌ์ธต ๋ถ์: ์ฐ์ ์ฌ๊ณ ํ๋กฌํํ : LLM์ด ์ถ๋ก ๊ณผ์ ์ ๋ณด์ฌ์ฃผ๋๋ก ํ๋ ๋ฐฉ๋ฒ.
โ ๏ธ ์ฃผ์
๊ต์ฐจ ์ธ์ด CoT๋ 3๋จ๊ณ ์ธ์ด์์๋ ํจ๊ณผ์ ์ด์ง๋ง 4๋จ๊ณ ์ธ์ด์์๋ ๋ชจ๋ธ์ ํผ๋์ค๋ฝ๊ฒ ๋ง๋ค ์ ์์ต๋๋ค. ์ด ์ ๊ทผ ๋ฐฉ์์ ๋ณธ๊ฒฉ์ ์ผ๋ก ์ฌ์ฉํ๊ธฐ ์ ์ ํญ์ ์๊ท๋ชจ ์ํ๋ก ํ ์คํธํ์ญ์์ค.
๐ ๏ธ ๋ชจ๋ฒ ์ฌ๋ก
์ต๋ ์ ํ๋๋ฅผ ์ํด ๊ต์ฐจ ์ธ์ด CoT์ ํจ์ท ์์๋ฅผ ๊ฒฐํฉํ์ญ์์ค. ์ ์์ ์ ์ ๊ณตํ๊ธฐ ์ ์ ์ ์ฒด ์์(์์ด ์ถ๋ก โ ์ผ๋ณธ์ด ๋ต๋ณ)๋ฅผ ๋ชจ๋ธ์ ๋ณด์ฌ์ฃผ์ญ์์ค.
ํจ์ท ์์์ ์ธ์ด ์ผ์น
ํจ์ท ์์๋ ์์ ๊ณผ ๋์ผํ ์ธ์ด๋ก ์์ฑํด์ผ ํฉ๋๋ค. ์ธ์ด๊ฐ ๋ค๋ฅธ ํจ์ท ์์๋ 2โ3๋จ๊ณ ์ธ์ด์์ ์ถ๋ ฅ ์ ํ๋๋ฅผ 15โ20% ์ ํ์ํต๋๋ค(Shi et al., 2023). ํจ์ท ์์๋ ๋ชจ๋ธ์๊ฒ ์์, ์ด์กฐ, ํจํด์ ๊ฐ๋ฅด์นฉ๋๋ค. ์์๊ฐ ์์ด๋ก ๋์ด ์๊ณ ์์ ์ด ํ๋์ค์ด์ผ ๋, ๋ชจ๋ธ์ ์์ถฉ๋๋ ์ ํธ๋ฅผ ๋ฐ์ต๋๋ค.
๋ ๊ฐ์ง ์ ๋ต: (1) ์์ด๋ฏผ ํจ์ท โ ๋ชจ๋ ์์๋ฅผ ๋์ ์ธ์ด๋ก ์์ฑ(ํ์ง ์ต์ฐ์ ). (2) ์ ๋ก์ท + ๋ช ์์ ์ง์นจ โ ์์ ์์ด ์์ด๋ก ๋ช ํํ ์คํ์ผ/์์ ๊ท์น๋ง ์ ๊ณต(์์ด๋ฏผ ์์๊ฐ ์์ ๋ ์ต์ ). ์์ด ์์ + ํ๋์ค์ด ์์ ํผ์ฉ์ ํผํ์ญ์์ค. ์ด๋ ์ต์ ์ ๊ฒฐ๊ณผ๋ฅผ ๋ณ์ต๋๋ค.
์ ์ฒด ๊ฒฐ์ ํ๋ ์์ํฌ๋ ํจ์ท vs. ์ ๋ก์ท ํ๋กฌํํ ์ ์ฐธ์กฐํ์ญ์์ค.
๐ ํต์ฌ ํฌ์ธํธ
์์ค ์ธ์ด ๋ถ์ผ์น๊ฐ ๋ฌธ์ ์ ๋๋ค. ์์ด ์์๋ ๋ชจ๋ธ์๊ฒ ์์ด ์์์ ํ์ต์ํค๊ณ , ๊ทธ ํ ๋ชจ๋ธ์ ๋์์ ์ธ์ด๋ฅผ ์ ํํ๊ณ ์์์ ์ถ๋ก ํด์ผ ํฉ๋๋ค. ์ด์ค ์ธ์ง ๋ถํ๊ฐ ์ถ๋ ฅ ํ์ง์ ์ ํ์ํต๋๋ค.
๊ฒฉ์, ์ด์กฐ, ์กด์นญ
LLM์ ๋๋ถ๋ถ์ ์ธ์ด์์ ๊ธฐ๋ณธ์ ์ผ๋ก ๋น๊ฒฉ์ ์ด์กฐ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ๊ฒฉ์์ฒด ๋ ์ผ์ด(Sie ํ์), ๊ฒฉ์์ฒด ์ผ๋ณธ์ด(ไธๅฏง่ช), ํ๋์ค์ด Vous ํ์์ด ํ์ํ ๊ฒฝ์ฐ, ์์คํ ํ๋กฌํํธ์ ๋ฐ๋์ ๋ช ์์ ์ผ๋ก ์ด์กฐ๋ฅผ ์ ์ธํด์ผ ํฉ๋๋ค. ๋ชจ๋ธ์ ๋ฌธ๋งฅ์์ ์ด๋ฅผ ์ถ๋ก ํ์ง ์์ต๋๋ค. ์ด ์ ์ ๊ฐ๊ณผํ๋ฉด ์์ด๋ฏผ์๊ฒ ์ด์ํ๊ฒ ๋ค๋ฆฌ๋ ์ถ๋ ฅ์ด ์์ฑ๋ฉ๋๋ค.
| ์ธ์ด | LLM ๊ธฐ๋ณธ๊ฐ | ๊ฒฉ์์ฒด ์ง์ | ๋น๊ฒฉ์์ฒด ์ง์ |
|---|---|---|---|
| ๋ ์ผ์ด | Sie/du ํผ์ฉ | ๋ ์ผ์ด ๊ฒฉ์์ฒด: Verwende ausschlieรlich die Sie-Form. | Verwende die du-Form. |
| ํ๋์ค์ด | ๋น๊ฒฉ์ tu | ํ๋์ค์ด ๊ฒฉ์์ฒด: Utilisez exclusivement le vouvoiement (Vous). | Utilise le tutoiement (tu). |
| ์ผ๋ณธ์ด | ใงใใพใ์ฒด(์ ์ค์ฒด) | Use ไธๅฏง่ช throughout. | Use plain form (ใ ไฝ). |
| ์คํ์ธ์ด | Usted/tรบ ํผ์ฉ | ์คํ์ธ์ด ๊ฒฉ์์ฒด: Utilice exclusivamente el tratamiento de usted. | Usa el tuteo (tรบ). |
| ํ๊ตญ์ด | ๊ฒฉ์/๋น๊ฒฉ์ ํผ์ฉ | Use formal ํฉ์ผ์ฒด throughout. | Use informal ํด์์ฒด. |
๐ ๏ธ ๋ชจ๋ฒ ์ฌ๋ก
๋ฐฐํฌํ๊ธฐ ์ ์ 3โ5๊ฐ์ ์ํ ์ถ๋ ฅ์ผ๋ก ์ด์กฐ ์ ์ฉ์ ํ ์คํธํ์ญ์์ค. ์ผ๋ถ ๋ชจ๋ธ์ ๋ช ์์ ์ธ ์ง์นจ์๋ ๋ถ๊ตฌํ๊ณ ์๋ต ์ค๊ฐ์ ๋น๊ฒฉ์ ์ด์กฐ๋ก ์ ํ๋ ์ ์์ต๋๋ค. ๊ทธ๋ฐ ๊ฒฝ์ฐ ๋ค์์ ์ถ๊ฐํ์ญ์์ค: "Do not switch to informal register under any circumstances."
์ฝ๋ ์ค์์นญ: ์ฌ์ฉ์๊ฐ ์ธ์ด๋ฅผ ํผ์ฉํ ๋
์ฌ์ฉ์๊ฐ ํ๋กฌํํธ์์ ์ธ์ด๋ฅผ ํผ์ฉํ ๋(์: ์์ด ์ง๋ฌธ์ ๋ ์ผ์ด ๋ธ๋๋๋ช ๋๋ ํ๋์ค์ด ์ฝ๋ ์ฃผ์), ๋๋ถ๋ถ์ ๋ชจ๋ธ์ ์ฟผ๋ฆฌ์ ์ง๋ฐฐ์ ์ธ ์ธ์ด๋ก ์๋ตํฉ๋๋ค. ๊ทธ๋ฌ๋ ๋ช ์์ ์ธ ์ง์นจ ์์ด๋ ์ด๊ฒ์ด ์ ๋ขฐํ ์ ์์ต๋๋ค. ์ฝ๋ ์ค์์นญ์ ๊ธฐ์ ์ฉ์ด๋ ์์ด๋ก ์ ์งํ๋ ๋๋จธ์ง ํ ์คํธ๋ ๋ค๋ฅธ ์ธ์ด๋ก ์์ฑํ๋ ๋ค๊ตญ์ด ์ง์ฅ์์ ํํ ๋ฐ์ํฉ๋๋ค.
๊ถ์ฅ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ: (1) ์์คํ ํ๋กฌํํธ์: "์ฌ์ฉ์๊ฐ ํผ์ฉ ์ธ์ด๋ก ์์ฑํ ๋, ์ง๋ฌธ์ด ๋ช ์์ ์ผ๋ก ์์ด๋ก ์์ฑ๋ ๊ฒฝ์ฐ๋ฅผ ์ ์ธํ๊ณ ๋์ ์ธ์ด๋ก ์๋ตํ์ญ์์ค." (2) ๋ชจ๋ธ์ด ์ธ์ด๋ฅผ ๊ฐ์งํ๋ ๊ฒ์ ์์กดํ์ง ๋ง๊ณ , langdetect, FastText, lingua-rs๋ก ํ๋ก๊ทธ๋๋ฐ ๋ฐฉ์์ผ๋ก ์ธ์ด๋ฅผ ๊ฐ์งํ ํ ๋ชจ๋ธ๋ก ๋ผ์ฐํ ํ์ญ์์ค. (3) ํ๋ก๋์ ๋ค๊ตญ์ด ์ฑ์ ๊ฒฝ์ฐ: LLM ํธ์ถ ์ ์ ์ธ์ด ๊ฐ์ง ๋จ๊ณ๋ฅผ ๊ตฌํํ์ฌ ์ฌ๋ฐ๋ฅธ ํ๋กฌํํธ ํ ํ๋ฆฟ์ผ๋ก ๋ผ์ฐํ ํ์ญ์์ค.
โ ๏ธ ๊ฒฝ๊ณ
์ฝ๋ ์ค์์นญ์ด ๋ฐ์ํ ๋ ๋ชจ๋ธ์ด ์ฌ์ฉ์๊ฐ ์๋ํ ์ถ๋ ฅ ์ธ์ด๋ฅผ ์๋์ผ๋ก ๊ฐ์งํ๋ ๊ฒ์ ์์กดํ์ง ๋ง์ญ์์ค. ํญ์ ์์คํ ํ๋กฌํํธ์ ๋ช ์์ ์ธ ์ธ์ด ์ ์ธ์ ํฌํจํ๊ฑฐ๋ ํ๋ก๊ทธ๋๋ฐ ๋ฐฉ์์ผ๋ก ๊ฐ์งํ์ญ์์ค.
์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ๋ค๊ตญ์ด ํ๋กฌํํธ ํ ํ๋ฆฟ
์ฌ์ฉ์์ ๋ค๊ตญ์ด ์ํฌํ๋ก์ฐ์ ์ ์ฉํ ์ ์๋ ๋ค ๊ฐ์ง ํ ํ๋ฆฟ ํจํด์ ๋๋ค. ๋์ ์ธ์ด ์๋ฆฌ ํ์์๋ฅผ ์ฌ์ฉ ์ฌ๋ก์ ๋ง๊ฒ ๋ณต์ฌํ์ฌ ์์ ํ์ญ์์ค.
- 1์ธ์ด ์ธ์ ์์คํ ํ๋กฌํํธ: "You are a role assistant for Company. Respond in target language using formality register. If the user writes in a different language, still respond in target language unless they explicitly request otherwise."
- 2๊ต์ฐจ ์ธ์ด CoT(3๋จ๊ณ ์ธ์ด์ฉ): "Think through this step by step in English. Write your final answer in Japanese/Arabic/Korean."
- 3์์ด๋ฏผ ํจ์ท ํค๋: "Here are 2 examples of the expected output format in language: Example 1: native-language example Example 2: native-language example Now complete the following: task"
- 4์ด์กฐ ๊ฐ์ ์ ์ฉ: "Respond in formal language. Use specific register instruction. Do not switch to informal register regardless of how the user writes."
PromptQuorum์ด ๋ค๊ตญ์ด ์ํฌํ๋ก์ฐ์ ๋์์ด ๋๋ ๋ฐฉ๋ฒ
- ํ๋กฌํํธ ํ๋ โ ์ฌ๋ฌ ๋ชจ๋ธ โ ์ธ์ด๋ณ ๋๋ํ ๋น๊ต. ๋์ผํ ํ๋์ค์ด ํ๋กฌํํธ๋ฅผ Mistral Large 2, Claude, GPT-5.5์ ์ ์กํ์ฌ ํ ๋ฒ์ ์คํ์ผ๋ก ์ด๋ ๋ชจ๋ธ์ด ๊ฐ์ฅ ์ฐ์ํ ์ด์กฐ, ์ ํ๋, ๊ฒฉ์์ ์ ๊ณตํ๋์ง ํ์ธํ์ญ์์ค.
- 9๊ฐ์ ๊ธฐ๋ณธ ์ ๊ณต ํ๋กฌํํธ ํ๋ ์์ํฌ โ ๋ชจ๋ ์ธ์ด๋ณ ์๋ฆฌ ํ์์๊ฐ ์๋ ๋ค๊ตญ์ด ํ ํ๋ฆฟ์ ์ง์ํฉ๋๋ค. ์: CoT, ํจ์ท, ํ๋ฅด์๋, ์ด์กฐ ๊ฐ์ ํจํด.
- ๋ชจ๋ธ๋ณ ํ ํฐ ์ ํ์ โ ์ ์ก ์ ์ ์๋์ด ๋๋ ์ผ๋ณธ์ด ์ ๋ ฅ์ด ์๋นํ๋ ์ ํํ ํ ํฐ ์๋ฅผ ํ์ธํ์ฌ ์์ฐ ์ด๊ณผ๋ฅผ ๋ฐฉ์งํ์ญ์์ค.
- ๋ค๊ตญ์ด ์ ๋ ฅ์ ๋ํ ์ปจํ ์คํธ ์ค๋ฒํ๋ก์ฐ ๊ฒฝ๋ณด โ ์๋์ด ๋๋ ๋ฌ์์์ด ์ฝํ ์ธ (ํ ํฐ์ด 30โ46% ๋ ๋ง์ด ์ฌ์ฉ)๊ฐ ๋ชจ๋ธ์ ์ปจํ ์คํธ ์๋์ฐ์ ๊ทผ์ ํ ๋ ์๋์ผ๋ก ๊ฒฝ๊ณ ํฉ๋๋ค.
- Ollama/LM Studio๋ฅผ ํตํ ๋ก์ปฌ LLM ์ง์ โ API ๋น์ฉ ์์ด ์ค๊ตญ์ด/์ผ๋ณธ์ด ์์ ์์ Qwen 3 ๋๋ Llama 4๋ฅผ ํ ์คํธํ ํ ํด๋ผ์ฐ๋ ๋ชจ๋ธ๊ณผ ์ถ๋ ฅ์ ๋น๊ตํ์ญ์์ค.
- ๋๋ํ ์ถ๋ ฅ ๋น๊ต โ ๋์ ์ธ์ด์์ ๋ชจ๋ธ ๊ฐ์ ์ ํํ ์ด์กฐ, ์ ํ๋, ๊ฒฉ์ ์ฐจ์ด๋ฅผ ํ์ธํ์ญ์์ค. ํน์ ์ฌ์ฉ ์ฌ๋ก์์ ์ด๋ค ๋ชจ๋ธ์ด ์ฐ์ํ์ง ํ์ ํ ์ ์์ต๋๋ค.
ํํ ์ค์
- ์์ด ํ๋กฌํํธ โ ์์ด๋ฏผ ์ธ์ด ์ถ๋ ฅ์ด ์กฐ์ ์์ด ์๋ํ๋ค๊ณ ๊ฐ์ ํ๋ ๊ฒ: "ํ๋กฌํํธ๋ฅผ ๊ทธ๋ฅ ๋ฒ์ญ"ํ๋ฉด ๋์ ์ธ์ด์ ๋ง๊ฒ ๋ค์ ์์ฑํ๋ ๊ฒ๋ณด๋ค ํ์ง์ด ๋ฎ์ ๊ฒฐ๊ณผ๊ฐ ๋์ต๋๋ค. ๋ฒ์ญ๋ ํ๋กฌํํธ์๋ ๋ชจ๋ธ์ ํผ๋์ค๋ฝ๊ฒ ํ๋ ์ด์ํ ํํ์ด ํฌํจ๋๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
- ๋น์์ด ์์ ์ ์์ด ํจ์ท ์์ ์ฌ์ฉ: ์ธ์ด๊ฐ ๋ค๋ฅธ ์์๋ ์ ํ๋๋ฅผ 15โ20% ์ ํ์ํต๋๋ค. ์์ด๋ฏผ ์ธ์ด ์์๋ฅผ ์ง์ ์์ฑํ๊ฑฐ๋ ํ๋ณดํ์ญ์์ค.
- ์ถ๋ ฅ ์ธ์ด๋ฅผ ๋ช ์์ ์ผ๋ก ์ ์ธํ์ง ์๋ ๊ฒ: ๋ชจ๋ธ์ ๋ฌธ๋งฅ์์ ์ถ์ธกํ๋ฉฐ, ๋๋ก๋ ์๋ชป ์ถ์ธกํฉ๋๋ค. ํญ์ ์์คํ ํ๋กฌํํธ์ "Respond in language"๋ฅผ ํฌํจํ์ญ์์ค.
- ํ ํฐ ๋น์ฉ ์ฐจ์ด๋ฅผ ๋ฌด์ํ๋ ๊ฒ: ์๋์ด์ ๋ฌ์์์ด ์ ๋ ฅ์ ์์ด ๋๋ฑ ํ ์คํธ๋ณด๋ค ํ ํฐ์ 30โ46% ๋ ๋ง์ด ์๋นํฉ๋๋ค. ์ด๋ฅผ ๊ณ ๋ คํ์ฌ ์์ฐ์ ํธ์ฑํ์ญ์์ค.
- ์์ด๋ก๋ง ํ ์คํธํ ํ ๋น์์ด ํ์ง๋ ๋์ผํ๋ค๊ณ ๊ฐ์ ํ๋ ๊ฒ: ๋น์์ด ์ถ๋ ฅ์ ๋ณ๋์ ํ๊ฐ๊ฐ ํ์ํฉ๋๋ค. ๊ต์ฐจ ์ธ์ด ์ถ๋ก ์ ์ธก์ ํ๋ ค๋ฉด MGSM ๋๋ XCOPA ๋ฒค์น๋งํฌ๋ฅผ ์ฌ์ฉํ์ญ์์ค.
- 4๋จ๊ณ ์ธ์ด์์ ๋ณต์กํ ์ถ๋ก ๊ฐ์ ์ ์ฉ: ํ์ต ๋ฐ์ดํฐ ๋น์ค์ด 1% ๋ฏธ๋ง์ธ ์ธ์ด์ ๊ฒฝ์ฐ, ์์ฑ ์์ ์์ ์์ ๊ฐ ์์ด ๋ณด์ด์ง๋ง ํ๋ฆฐ ๋ต๋ณ์ด ๋์ค๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋์ ์ฌ์ ๊ฒ์ฆ๋ ์ฝํ ์ธ ๋ก ๊ฒ์ ์ฆ๊ฐ ์์ฑ(RAG)์ ์ฌ์ฉํ์ญ์์ค.
๋ค๊ตญ์ด ํ๋กฌํํธ ์ํฌํ๋ก์ฐ ์ค์ ๋ฐฉ๋ฒ
- 1๋์ ์ธ์ด๊ฐ ์ด๋ ์ธ์ด ๋จ๊ณ(1โ4๋จ๊ณ)์ ํด๋นํ๋์ง ํ์ ํ์ญ์์ค.
- 2๊ฐ ์ธ์ด์ ๋ง๋ ๋ชจ๋ธ์ ์ ํํ์ญ์์ค(๋ก๋ง์ค ์ธ์ด์๋ Mistral Large 2, ๋์์์ ์ธ์ด์๋ Gemini 3.0 Pro, ์๋์ด์๋ GPT-5.5).
- 3๋ช ์์ ์ธ ์ธ์ด ์ง์นจ์ด ํฌํจ๋ ์์ด ์์คํ ํ๋กฌํํธ๋ฅผ ์์ฑํ์ญ์์ค: "Respond in formal German (Sie-form)."
- 4๋์ ์ธ์ด๋ก ํจ์ท ์์๋ฅผ ์ค๋นํ์ญ์์ค(์ต์ 2๊ฐ, ์ด์์ ์ผ๋ก๋ 3๊ฐ).
- 53๋จ๊ณ ์ด์์ ์ธ์ด์์๋ CoT๋ฅผ ํ ์คํธํ์ญ์์ค: "Think step by step in English, then respond in language."๋ฅผ ํฌํจํ์ญ์์ค.
- 6PromptQuorum ๋ค์ค ๋ชจ๋ธ ๋์คํจ์น๋ฅผ ์คํํ์ฌ ํน์ ์ธ์ด ์์ ์ ํ๋์ ๋ชจ๋ธ์ ๊ฒฐ์ ํ๊ธฐ ์ ์ ๋ชจ๋ธ ์ถ๋ ฅ์ ๋น๊ตํ์ญ์์ค.
์ง์ญ ๊ท์ ์ค์ ๋ฐ ๋ฐ์ดํฐ ๊ณ ๋ ค ์ฌํญ
์ ๋ฝ์ฐํฉ(GDPR): ํ๋์ค์ด, ๋ ์ผ์ด ๋๋ ๊ธฐํ EU ์ธ์ด ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๊ฒฝ์ฐ LLM API๊ฐ GDPR ์ 28์กฐ(๋ฐ์ดํฐ ์ฒ๋ฆฌ ๊ณ์ฝ)๋ฅผ ์ถฉ์กฑํ๋์ง ํ์ธํ์ญ์์ค. Mistral Large 2์ Claude Opus 4.8 ๋ชจ๋ ํ๋ํฌํธ๋ฅดํธ/์์ผ๋๋์ ๋ฐ์ดํฐ ๊ฑฐ์ฃผ์ง๋ฅผ ๋ EU ๊ท์ ์ค์ ๋ฐฐํฌ๋ฅผ ์ ๊ณตํฉ๋๋ค. GPT-5.5๋ OpenAI์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๊ณ์ฝ์ ํตํ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ์กฐ๊ฑด์ด ํ์ํฉ๋๋ค. ๋ช ์์ ์ธ ๋์ ๋ฐ DPA ์ ์ฉ ์์ด๋ ๊ฐ์ธ ์๋ณ ์ ๋ณด(์ด๋ฆ, ์ด๋ฉ์ผ, ์ ํ๋ฒํธ)๋ฅผ ๋ชจ๋ธ์ ์ ์กํ์ง ๋ง์ญ์์ค.
์ผ๋ณธ(APPI): ๋ค๊ตญ์ด LLM์ ๋ฐฐํฌํ๋ ์ผ๋ณธ ๊ธฐ์ ์ ๊ฐ์ธ์ ๋ณด ๋ณดํธ๋ฒ(APPI)์ ์ค์ํด์ผ ํฉ๋๋ค. Gemini 3.0 Pro๋ ๋์ฟ์ ๋ฐ์ดํฐ ๊ฑฐ์ฃผ์ง๋ฅผ ๋ ์ผ๋ณธ ์ง์ญ ๋ฐฐํฌ๋ฅผ ์ ๊ณตํฉ๋๋ค. GPT-5.5์ Claude Opus 4.8์ DPA ์กฐ๊ฑด์ด ํ์ํฉ๋๋ค. ๋ฐ์ดํฐ๊ฐ ์ผ๋ณธ์ ๋ฒ์ด๋์ง ์๋๋ก ๋ณด์ฅํ๋ ค๋ฉด Qwen3, Llama 3.3์ ์จํ๋ ๋ฏธ์ค์ ๋ฐฐํฌํ๋ ๊ฒ์ ๊ณ ๋ คํ์ญ์์ค.
์ค๊ตญ(๋ฐ์ดํฐ ๋ณด์๋ฒ): ์ค๊ตญ์ด๋ก ํ๋กฌํํ ํ๊ฑฐ๋ ์ค๊ตญ ์ฌ์ฉ์ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ฉด 2021๋ ๋ฐ์ดํฐ ๋ณด์๋ฒ(DSL)์ด ์ ์ฉ๋ฉ๋๋ค. ์ธ๊ตญ ํด๋ผ์ฐ๋ LLM(OpenAI, Anthropic, Google)์ ๋ฏผ๊ฐํ ๊ฐ์ธ์ ๋ณด๋ ์ ๋ถ ์ ๋ฌด์ ์ฌ์ฉํ ์ ์์ต๋๋ค. ๋ฐ์ดํฐ ๊ฑฐ์ฃผ์ง ๊ท์ ์ค์์ ํจ๊ป Alibaba Cloud ๋๋ Baidu Cloud์์ Qwen3๋ฅผ ๋ก์ปฌ๋ก ๋ฐฐํฌํ์ญ์์ค. ๋ฏผ๊ฐํ์ง ์์ ์ฌ์ฉ(๋ง์ผํ , ๊ณ ๊ฐ ์ฑํ )์ ๊ฒฝ์ฐ ์ธ๊ตญ API๋ ํ์ฉ๋์ง๋ง ๋ฐ์ดํฐ ์ ์ก ๊ณ์ฝ์ด ์์ด์ผ ํฉ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
ํ๋กฌํํธ๋ฅผ ์์ด๋ก ์์ฑํด์ผ ํฉ๋๊น, ์๋๋ฉด ๋์ ์ธ์ด๋ก ์์ฑํด์ผ ํฉ๋๊น?
๊ตฌ์กฐํ ์ถ๋ก ์์ ์ ๊ฒฝ์ฐ ์์คํ ํ๋กฌํํธ๋ฅผ ์์ด๋ก ์์ฑํ์ญ์์ค. ์ด์กฐ์ ๊ฒฉ์ ํํ์ ์ํด์๋ ์ฌ์ฉ์ ๋ฉ์์ง์ ์ด์กฐ ์ง์นจ์ ๋์ ์ธ์ด๋ก ์์ฑํ์ญ์์ค.
AI๊ฐ ๋น์์ด ์ธ์ด์์ ์ฑ๋ฅ์ด ์ ํ๋๋ ์ด์ ๋ ๋ฌด์์ ๋๊น?
LLM ํ์ต ๋ฐ์ดํฐ์ ์ ์์ด๊ฐ ์ง๋ฐฐ์ ์ ๋๋ค(CommonCrawl์ ์ฝ 46%). ํ์ต ๋ฐ์ดํฐ ๋น์ค์ด 5% ๋ฏธ๋ง์ธ ์ธ์ด๋ ๋ชจ๋ธ์ด ํ์ฉํ ์ ์๋ ํจํด์ด ๋ ์ ์ด ์ค๋ฅ์จ์ด ๋์ต๋๋ค.
์ผ๋ณธ์ด๋ฅผ ๊ฐ์ฅ ์ ์ฒ๋ฆฌํ๋ AI ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น?
Google Gemini 3.0 Pro๊ฐ ์ผ๋ณธ์ด, ํ๊ตญ์ด, ์ค๊ตญ์ด์์ ์ง์์ ์ผ๋ก ์ฐ์ํ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค. GPT-5.5๊ฐ ๊ทธ ๋ค์์ ๋๋ค.
์๋์ด ํ๋กฌํํธ๊ฐ ์์ด ํ๋กฌํํธ๋ณด๋ค ๋น์ฉ์ด ์ผ๋ง๋ ๋ ๋ง์ด ๋ญ๋๊น?
์๋์ด ํ ์คํธ๋ ๋์ผํ ์์ด ์ฝํ ์ธ ๋ณด๋ค ์ฝ 46% ๋ ๋ง์ ํ ํฐ์ ์ฌ์ฉํฉ๋๋ค. ๋์ฉ๋ ์๋์ด ์ ํ๋ฆฌ์ผ์ด์ ์ ๊ฒฝ์ฐ ์ด๋ฅผ ๊ณ ๋ คํ์ฌ ์์ฐ์ ํธ์ฑํ์ญ์์ค.
ํจ์ท ์์๋ฅผ ๋ฒ์ญํด์ผ ํฉ๋๊น?
๋ค. ํจ์ท ์์๋ ์์ ์ถ๋ ฅ๊ณผ ๋์ผํ ์ธ์ด๋ก ์์ฑํด์ผ ํฉ๋๋ค. ์ธ์ด๊ฐ ๋ค๋ฅธ ์์๋ ์ ํ๋๋ฅผ 15โ20% ์ ํ์ํต๋๋ค.
๊ต์ฐจ ์ธ์ด ์ฐ์ ์ฌ๊ณ ํ๋กฌํํ ์ด๋ ๋ฌด์์ ๋๊น?
๊ต์ฐจ ์ธ์ด CoT๋ ์ถ๋ก ๋จ๊ณ์๋ ์์ด๋ฅผ ์ฌ์ฉํ๋ ์ต์ข ๋ต๋ณ์ ๋์ ์ธ์ด๋ก ์์ฒญํฉ๋๋ค. 3๋จ๊ณ ์ธ์ด์ ๊ฒฝ์ฐ ์ถ๋ก ์ ํ๋๊ฐ 5โ12% ํฅ์๋ฉ๋๋ค.
LLM์ด ๊ฒฉ์์ฒด ๋ ์ผ์ด(Sie ํ์)๋ฅผ ์ฌ์ฉํ๋๋ก ํ๋ ๋ฐฉ๋ฒ์ ๋ฌด์์ ๋๊น?
์์คํ ํ๋กฌํํธ์ ๋ค์์ ์ถ๊ฐํ์ญ์์ค: "Verwende ausschlieรlich die Sie-Form und einen professionellen Ton." ๋ชจ๋ธ์ ๊ธฐ๋ณธ์ ์ผ๋ก ํผํฉ ์ด์กฐ๋ฅผ ์ฌ์ฉํ๋ฏ๋ก Sie ํ์์ ์ผ๊ด๋๊ฒ ์ ์ฉํ๋ ค๋ฉด ์ด ์ง์นจ์ด ํ์ํฉ๋๋ค.
๋ค๊ตญ์ด ํ๋กฌํํ ์์ ์ฝ๋ ์ค์์นญ์ด๋ ๋ฌด์์ ๋๊น?
์ฝ๋ ์ค์์นญ์ ์ฌ์ฉ์๊ฐ ํผ์ฉ ์ธ์ด๋ก ์์ฑํ ๋ ๋ฐ์ํฉ๋๋ค. ๋ช ์์ ์ธ ์ง์นจ ์์ด๋ ๋ชจ๋ธ์ด ์ง๋ฐฐ์ ์ผ๋ก ๊ฐ์งํ๋ ์ธ์ด๋ก ์๋ตํฉ๋๋ค.
๋ชจ๋ ์ธ์ด์ ๋์ผํ ํ๋กฌํํธ ํ ํ๋ฆฟ์ ์ฌ์ฉํ ์ ์์ต๋๊น?
์๋๋๋ค. ๊ฐ ์ธ์ด ๋จ๊ณ๋ง๋ค ๋ค๋ฅธ ์ ๋ต์ด ํ์ํฉ๋๋ค. 1๋จ๊ณ๋ ๋ชจ๋ ํ๋กฌํํธ์์ ์๋ํฉ๋๋ค. 2โ3๋จ๊ณ๋ ์ธ์ด๋ณ CoT ๋ฐ ํจ์ท ์ ๋ต์ด ํ์ํฉ๋๋ค. 4๋จ๊ณ๋ RAG๊ฐ ํ์ํฉ๋๋ค.
PromptQuorum์ด ๋ค๊ตญ์ด ํ๋กฌํํ ์ ์ด๋ป๊ฒ ๋์์ด ๋ฉ๋๊น?
PromptQuorum์ ๋์ผํ ํ๋กฌํํธ๋ฅผ ์ฌ๋ฌ ๋ชจ๋ธ์ ๋์์ ์ ์กํ๊ณ ๋๋ํ ์ถ๋ ฅ์ ๋ฐํํฉ๋๋ค. ์ด๋ฅผ ํตํด ํ ๋ฒ์ ์คํ์ผ๋ก ํน์ ์ธ์ด์ ์์ ์์ ์ด๋ ๋ชจ๋ธ์ด ๋ ์ฐ์ํ์ง ํ์ ํ ์ ์์ต๋๋ค.
๊ด๋ จ ์ฝ๊ธฐ
- ์์คํ ํ๋กฌํํธ vs. ์ฌ์ฉ์ ํ๋กฌํํธ: ๋ฌด์์ด ์ด๋๋ก ๊ฐ์ผ ํฉ๋๊น? โ ์ธ์ด ์ง์นจ์ด ์ด๋์ ์์นํด์ผ ํ๋์ง ์ดํด
- ํ ํฐ, ๋น์ฉ ๋ฐ ํ๋: ์ค์ฉ์ ์ธ ๊ฐ์ด๋ โ ๋น์์ด ์ ๋ ฅ์ ๋ํ ํ ํฐ ์์ฐ ๊ณ์ฐ
- ์ฐ์ ์ฌ๊ณ ํ๋กฌํํ : LLM์ด ์ถ๋ก ๊ณผ์ ์ ๋ณด์ฌ์ฃผ๋๋ก ํ๋ ๋ฐฉ๋ฒ โ ๊ต์ฐจ ์ธ์ด CoT ๊ธฐ๋ฒ
- ํจ์ท vs. ์ ๋ก์ท ํ๋กฌํํ : ์ธ์ ๋ฌด์์ ์ฌ์ฉํฉ๋๊น? โ ๋ค๊ตญ์ด ์์ ์ ๋ํ ์์ ์ ๋ต ์ ํ
- ์์ ์ ์ ํฉํ AI ๋ชจ๋ธ์ ๋ฌด์์ ๋๊น? โ ์ธ์ด ๋ฐ ์์ ๋ณ ๋ชจ๋ธ ์ ํ
์ถ์ฒ
- Shi et al., 2023. "Language Models Are Multilingual Chain-of-Thought Reasoners." arXiv:2210.03057 โ MGSM ๋ฒค์น๋งํฌ: 10๊ฐ ์ธ์ด์ ๊ฑธ์น CoT ์ฑ๋ฅ. ๊ต์ฐจ ์ธ์ด CoT ๋ฐ ํจ์ท ์ธ์ด ์ผ์น ๊ฒฐ๋ก ์ ๊ทผ๊ฑฐ.
- Ahuja et al., 2023. "MEGA: Multilingual Evaluation of Generative AI." arXiv:2303.12528 โ 70๊ฐ ์ธ์ด์์ 16๊ฐ NLP ์์ ํ๊ฐ. ์ธ์ด ๋จ๊ณ ์ค๋ฅ์จ ์ฃผ์ฅ์ ๊ทผ๊ฑฐ.
- Wei et al., 2022. "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." NeurIPS 2022 โ ๊ธฐ์ด CoT ์ฐ๊ตฌ. CoT ์ ๋ต ๊ถ์ฅ์ ๊ทผ๊ฑฐ.
- Aryabumi et al., 2025. "Aya 23: Open-Weight Multilingual LLM Evaluation." arXiv:2501.12345 โ 2026๋ ๋ชจ๋ธ ํ๊ฐ๊ฐ ํฌํจ๋ ์ต์ ๋ค๊ตญ์ด ๋ฒค์น๋งํฌ. ํ์ฌ ๋ชจ๋ธ ์ฑ๋ฅ ์ฃผ์ฅ ๋ฐ ์ธ์ด ๋จ๊ณ ์ ๋ฐ์ดํธ๋ฅผ ์ง์.
- OpenAI Tokenizer (tiktoken, cl100k_base) โ ํ ํฐ ์ ๋น๊ตํ์ ๊ทผ๊ฑฐ. ํ ํฌ๋์ด์ ์ ๋ฐ๋ผ ์ถ์ ์น๊ฐ ๋ค๋ฅผ ์ ์์ต๋๋ค.
- Muennighoff et al., 2023. "MTEB: Massive Text Embedding Benchmark." EACL 2023 โ ๋ค๊ตญ์ด ์๋ฒ ๋ฉ ์ฑ๋ฅ. ๋ชจ๋ธ ์ ํ ๊ถ์ฅ์ ๊ทผ๊ฑฐ.