๋น ๋ฅธ ์ฌ์ค
- 1์ต์ด ์ ์์: Wei ์ธ (2022), Google Brain โ NeurIPS 2022 ์ฐฝ์ ๋ ผ๋ฌธ
- 2ํต์ฌ ๊ฒฐ๊ณผ: Zero-shot CoT๋ก PaLM 540B์ MultiArith ์ ํ๋๊ฐ 17.7%์์ 78.7%๋ก ํฅ์
- 3ํ์ฑํ ๋ฌธ๊ตฌ: "๋จ๊ณ๋ณ๋ก ์๊ฐํด ๋ณด์" (zero-shot) ๋๋ ํ์ด๋ ์์ (few-shot)
- 42026๋ ๋ฐ์ : ๋ด์ฅ ์ถ๋ก ๋ชจ๋(o3, Claude extended thinking)๊ฐ CoT๋ฅผ ๋ด๋ถ์ ์ผ๋ก ์๋ํ
- 5๋น์ฉ ์ํฅ: ํ๋กฌํํธ ์์ค CoT = ์ถ๋ ฅ ํ ํฐ ์ฆ๊ฐ; ์ถ๋ก ๋ชจ๋ = ๋ณ๋ ์ฌ๊ณ ํ ํฐ ์์ฐ
- 6ํ๋กฌํํธ ์์ค CoT์ ์ต์ ์ธ ๋ชจ๋ธ: ๋น์ถ๋ก ๋ชจ๋ธ (Claude Haiku 4.5, Gemini Flash, GPT-5.5 mini, LLaMA 4 Scout)
Chain-of-thought ํ๋กฌํํ ์ด๋ ๋ฌด์์ธ๊ฐ
Chain-of-thought ํ๋กฌํํ ์ ๋ชจ๋ธ์ด ์ต์ข ๊ฒฐ๋ก ์ ๋๋ฌํ๊ธฐ ์ ์ ๋จ๊ณ๋ณ๋ก ์ถ๋ก ํ๋๋ก ์์ฒญํฉ๋๋ค. ๋ต๋ณ๋ง ๋ฐํํ๋ ๋์ , ๋ชจ๋ธ์ด ์ค๊ฐ ๊ณ์ฐ, ๋ ผ๋ฆฌ์ ๋จ๊ณ, ์ค๋ช ์ ์์ฑํฉ๋๋ค.
๋จ๊ณ๋ณ๋ก ์๊ฐํด ๋ณด์, ์ถ๋ก ๊ณผ์ ์ ๋ณด์ฌ์ค ๊ฐ์ ์ง์ ๋๋ ์ถ๋ก ์ด ๋ช ์๋ ํ์ด๋ ์์๋ฅผ ์ ๊ณตํจ์ผ๋ก์จ ์ด ๋์์ ํ์ฑํํ ์ ์์ต๋๋ค. ๊ฒฐ๊ณผ๋ ๋ชจ๋ธ์ด ์ด๋ป๊ฒ ๊ฒฐ๋ก ์ ๋๋ฌํ๋์ง ์ดํดํ ์ ์๋ ์ถ์ ๊ฒฝ๋ก๊ฐ ๋ฉ๋๋ค.
Chain-of-thought ํ๋กฌํํ ์ด ์ค์ํ ์ด์
Chain-of-thought ํ๋กฌํํ ์ ๋ค๋จ๊ณ ์ถ๋ก ์ด ํ์ํ ์์ ์์ ๋ชจ๋ธ์ ๋์์ ๋ ํฌ๋ช ํ๊ฒ ๋ง๋ค๊ธฐ ๋๋ฌธ์ ์ค์ํฉ๋๋ค. ๊ฐ ๋จ๊ณ๋ฅผ ๋ณผ ์ ์์ผ๋ฉด ์คํด, ๋๋ฝ๋ ๊ฐ์ , ์ฐ์ ์ค๋ฅ๋ฅผ ๋ฐ๊ฒฌํ ์ ์์ต๋๋ค.
์ด๋ ๋ถ์, ๊ณํ ์๋ฆฝ, ๋ฌธ์ ํด๊ฒฐ ๋ถ์ผ์์ ํนํ ๊ฐ์น ์์ต๋๋ค. ๋ถํฌ๋ช ํ ์ถ๋ ฅ ๋์ ๊ฒ์ฆํ๊ฑฐ๋, ์์ ํ๊ฑฐ๋, ๋ฌธ์๋ก ์ฌ์ฌ์ฉํ ์ ์๋ ์์ ์ ์ป๊ฒ ๋ฉ๋๋ค.
๐ ๋ก์ปฌ ๋ชจ๋ธ์์๋ ์๋ํฉ๋๋ค
Chain-of-thought๋ 7B+ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๋ชจ๋ ๋ชจ๋ธ์์ ์๋ํฉ๋๋ค. Ollama ๋๋ LM Studio๋ก ๋ก์ปฌ์์ ์ํํด ๋ณด์ธ์.
์ธ์ Chain-of-thought๊ฐ ๋์์ด ๋๋๊ฐ (๊ทธ๋ฆฌ๊ณ ์ธ์ ์๋๊ฐ)
Chain-of-thought ํ๋กฌํํ ์ ๋ช ํํ ๋จ๊ณ๋ก ์์ฐ์ค๋ฝ๊ฒ ๋๋๋ ์์ ์์ ๊ฐ์ฅ ๋์์ด ๋์ง๋ง, ๋ชจ๋ ํ๋กฌํํธ์ ํ์ํ ๊ฒ์ ์๋๋๋ค. ๋ชฉ์ ์ง๋งํผ ๊ฒฝ๋ก๊ฐ ์ค์ํ ๋ ๋น์ ๋ฐํฉ๋๋ค.
Chain-of-thought ์ถ๋ก ์ ๋๊ตฌ ํธ์ถ์ด ์๋ ์์ด์ ํธ๊ฐ ๋ค๋จ๊ณ ์์ ์์ ์ ๋ขฐ์ฑ์ ๊ฐ์ถ๊ฒ ํ๋ ํต์ฌ์ ๋๋ค. MCP๋ฅผ ํ์ฉํ ๋ก์ปฌ ์์ด์ ํธ ์คํ์ ๋ํด์๋ MCP๋ฅผ ํ์ฉํ ๋ก์ปฌ AI ์์ด์ ํธ๋ฅผ ์ฐธ์กฐํ์ธ์.
์ข์ ์ฌ์ฉ ์ฌ๋ก๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ์ํ ๋ฐ ์ ๋์ ์ถ๋ก ๋ฌธ์ .
- ๋ค๋จ๊ณ ๋ ผ๋ฆฌ ํผ์ฆ ๋๋ ์์ฌ๊ฒฐ์ ๋ถ์.
- ๊ทผ๋ณธ ์์ธ ๋ถ์, ์ฌ๊ณ ํ ๊ฒํ , ํธ๋ ์ด๋์คํ ๋ ผ์.
- ์์ ์์๊ฐ ๋ช ์์ ์ด์ด์ผ ํ๋ ๊ณํ ์๋ฆฝ ์์ .
๋จ์ ๋ถ๋ฅ, ๋น ๋ฅธ ์์ฑ, ์งง์ ์ฌ์ค ๊ธฐ๋ฐ ๋ต๋ณ์ ๊ฒฝ์ฐ chain-of-thought๋ ์ถ๊ฐ ๊ฐ์น ์์ด ์ฅํฉํจ๋ง ๋ํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. ๋ฏผ๊ฐํ ๋ถ์ผ์์๋ ์ถ๋ก ์ ๋ด๋ถ์ ์ผ๋ก ์ ์งํ๊ณ ์ฌ์ฉ์์๊ฒ๋ ์ต์ข ๋ต๋ณ๋ง ํ์ํ๊ณ ์ถ์ ์๋ ์์ต๋๋ค.
์์: Chain-of-thought ์์ vs. ์์
์ง์ ๋ต๋ณ ํ๋กฌํํธ์ ๋ช ์์ ์ผ๋ก ์ถ๋ก ์ ์์ฒญํ๋ ํ๋กฌํํธ๋ฅผ ๋น๊ตํ๋ฉด ์ฐจ์ด๊ฐ ๋ถ๋ช ํด์ง๋๋ค. ๊ฐ๋จํ ์์ฌ๊ฒฐ์ ์์์ ๋๋ค.
๋ฏธํกํ ํ๋กฌํํธ
"๋ค์ ๋ถ๊ธฐ์ ์ด๋ค ํ๋ก์ ํธ๋ฅผ ์ฐ์ ์ํด์ผ ํฉ๋๊น?"
๊ฐ์ ๋ ํ๋กฌํํธ
"๋น์ ์ ์ ํ ์ด์ ๊ด๋ฆฌ์์ ๋๋ค. ๋ค์ ๋ถ๊ธฐ ํ๋ณด ํ๋ก์ ํธ๊ฐ ์ธ ๊ฐ์ง ์์ต๋๋ค. Chain-of-thought ์ถ๋ก ์ ์ฌ์ฉํ์ฌ ์ฐ์ ์ํ ํ๋ก์ ํธ๋ฅผ ๊ฒฐ์ ํ์ธ์. 1) ์ฌ์ฉํ ์์ฌ๊ฒฐ์ ๊ธฐ์ค์ ๋์ดํ์ธ์ (์: ๋งค์ถ ์ํฅ, ์ํ๋, ์ ๋ต์ ์ ๋ ฌ). 2) ๊ฐ ๊ธฐ์ค์ ๋ํด ๊ฐ ํ๋ก์ ํธ๋ฅผ ๋จ๊ณ๋ณ๋ก ํ๊ฐํ์ธ์. 3) ๋ช ํํ ์ถ์ฒ์ ์ ์ํ๊ณ 3~5๋ฌธ์ฅ์ผ๋ก ์ ๋นํํ์ธ์. ๋ง์ง๋ง์ ๋ณ๋ ์ค์ ์ถ์ฒ: ์ผ๋ก ์์ํ๋ ์งง์ ์ต์ข ๋ต๋ณ์ ์ ๊ณตํ์ธ์."
๊ฐ์ ๋ ๋ฒ์ ์์ ๋ชจ๋ธ์ ๊ธฐ์ค์ ์ด๋ป๊ฒ ์ ํํ๋์ง, ๊ฐ ํ๋ก์ ํธ๋ฅผ ์ด๋ป๊ฒ ์ ์ํํ๋์ง ์ค๋ช ํ ๋ค์ ๋ฐ๋ฐํ๊ฑฐ๋ ์์ฉํ ์ ์๋ ์ถ์ฒ์ ์ ์ํฉ๋๋ค.
ํจ๊ณผ์ ์ธ Chain-of-thought ํ๋กฌํํธ ์์ฑ๋ฒ
ํจ๊ณผ์ ์ธ chain-of-thought ํ๋กฌํํธ๋ฅผ ์์ฑํ๋ ค๋ฉด ์ถ๋ก ๊ตฌ์กฐ์ ์ต์ข ๋ต๋ณ ๊ตฌ์กฐ๋ฅผ ๋ชจ๋ ์ ์ํด์ผ ํฉ๋๋ค. ๋ ์ค๋ช ํด์ค ๊ฐ์ ๋ง์ฐํ ์์ฒญ์ ๊ตฌ์ฒด์ ์ธ ์ง์๋ณด๋ค ์ ๋ขฐ์ฑ์ด ๋จ์ด์ง๋๋ค.
์ค์ฉ์ ์ธ ํจํด์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ๋ชจ๋ธ์๊ฒ ์ญํ ์ ์๋ ค์ฃผ์ธ์ (์: "๋น์ ์ ์๋์ด ๋ฐ์ดํฐ ๋ถ์๊ฐ์ ๋๋ค.").
- ๋จ๊ณ๋ณ๋ก ์๊ฐํ๊ฑฐ๋ chain-of-thought๋ฅผ ์ฌ์ฉํด์ผ ํ๋ค๊ณ ๋ช ์ํ์ธ์.
- ๊ธฐ๋ํ๋ ์ถ๋ก ์น์ ์ ์ ์ํ์ธ์ (์: ๊ฐ์ , ๊ณ์ฐ, ๋น๊ต, ๊ฒฐ๋ก ).
- ๋น ๋ฅด๊ฒ ์ฌ์ฉํ ์ ์๋๋ก ๋ง์ง๋ง์ ์งง๊ณ ๋ช ํํ๊ฒ ํ์๋ ์ต์ข ๋ต๋ณ์ ์์ฒญํ์ธ์.
์ด๋ ๊ฒ ํ๋ฉด ์์ธํ ์ถ๋ก ๊ณผ ๊ฐ๊ฒฐํ ์ถ๋ ฅ์ด ๋ถ๋ฆฌ๋์ด, ๊ฒฐ๊ณผ๋ฅผ ๋ค๋ฅธ ๋๊ตฌ๋ ๋ณด๊ณ ์์ ํตํฉํ ๋ ์ ์ฉํฉ๋๋ค.
PromptQuorum์์์ Chain-of-thought ํ๋กฌํํ
PromptQuorum์ ์ฌ๋ฌ ๋ชจ๋ธ์์ chain-of-thought ํ๋กฌํํ ์ ์ผ๊ด์ฑ ์๊ฒ ์ ์ฉํ ์ ์๋ ๋ฉํฐ๋ชจ๋ธ AI ๋์คํจ์น ๋๊ตฌ์ ๋๋ค. ๊ตฌ์กฐํ๋ chain-of-thought ํ๋กฌํํธ๋ฅผ ์์ฑํ๊ณ ์ฌ๋ฌ ๊ณต๊ธ์์๊ฒ ๋ณ๋ ฌ๋ก ์ ์กํฉ๋๋ค.
PromptQuorum์์ ๋ค์์ ์ํํ ์ ์์ต๋๋ค:
- Chain-of-thought ์ง์์ TRACE ๋๋ APE ๊ฐ์ ์ถ๋ก ์ค์ฌ ํ๋ ์์ํฌ๋ฅผ ๊ฒฐํฉํ์ฌ ์ฌ๊ณ ๋จ๊ณ๊ฐ ๋ช ์์ ์ผ๋ก ๋ ์ด๋ธ๋ง๋๋๋ก ํฉ๋๋ค.
- ์๋ก ๋ค๋ฅธ ๋ชจ๋ธ์ด ๋์ผํ ์ถ๋ก ์์ ์ ์ฒ๋ฆฌํ๋ ๋ฐฉ์์ ๋น๊ตํ๊ณ ๋จ๊ณ๋ณ ์ถ์ ๊ณผ์ ์ ๋๋ํ ๊ฒ์ฌํฉ๋๋ค.
- ๋ฐ๋ณต์ ์ธ ๋ถ์, ์ฌ๊ณ ๊ฒํ , ์ ๋ต์ ์์ฌ๊ฒฐ์ ์ ์ํด chain-of-thought ํ๋กฌํํธ๋ฅผ ํ ํ๋ฆฟ์ผ๋ก ์ ์ฅํฉ๋๋ค.
์ด๋ฅผ ํตํด chain-of-thought ํ๋กฌํํ ์ด ์ผํ์ฑ ์๋ น์์ ๋ฐ๋ณต ๊ฐ๋ฅํ ์์ฌ๊ฒฐ์ ํ๋ก์ธ์ค์ ์ผ๋ถ๋ก ์ ํ๋ฉ๋๋ค.
CoT ํ๋กฌํํ ์ฌ์ฉ ๋ฐฉ๋ฒ
- 1๋ ผ๋ฆฌ, ์ถ๋ก , ๋๋ฒ๊น ์์ ์์๋ ๋ชจ๋ธ์๊ฒ ๋ต๋ณ ์ ์ ๋จ๊ณ๋ณ๋ก ์๊ฐํด๋ผ๊ณ ์์ฒญํ์ธ์. ๋ฒ๊ทธ๊ฐ ๋ญ์ผ? ๋์ ์คํ ๊ณผ์ ์ ๋จ๊ณ๋ณ๋ก ์ถ์ ํ ๋ค์ ๋ฒ๊ทธ๋ฅผ ์ฐพ์์ค๋ผ๊ณ ์ง๋ฌธํ์ธ์.
- 2๋จ๊ณ๋ณ ์ถ๋ก ์ ๋ณด์ฌ์ฃผ๋ ํ์ด๋ ์์๋ฅผ ์ ๊ณตํ์ธ์. ์ค๋ช ๋ง ํ์ง ๋ง๊ณ , ๋ชจ๋ธ์๊ฒ ๋จ๊ณ๋ณ ์ถ๋ก ์ด ์ด๋ป๊ฒ ๋ณด์ด๋์ง ๋ณด์ฌ์ฃผ์ธ์. ์์: "๋จผ์ ํจ์ ์๊ทธ๋์ฒ๋ฅผ ๊ฒํ ํฉ๋๋ค... ๊ทธ๋ค์ ์ ๋ ฅ X๋ก ์ฒซ ๋ฒ์งธ ํธ์ถ์ ์ถ์ ํฉ๋๋ค..."
- 3๋จ๊ณ๋ณ๋ก ์๊ฐํด ๋ด ์๋ค ๋๋ ๋จผ์ , ํ์ ํ์ธ์... ๊ทธ๋ค์... ๊ฐ์ ๋ช ์์ ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ธ์. ์ด๋ ๊ฒ ํ๋ฉด ๋ชจ๋ธ์์ ๋ ์ ์คํ ์ถ๋ก ์ด ํ์ฑํ๋ฉ๋๋ค.
- 4๋ณต์กํ ๋ฌธ์ ์ ๊ฒฝ์ฐ ๋ชจ๋ธ์๊ฒ ์ค๊ฐ ์ถ๋ ฅ์ ์ถ์ ํ๋๋ก ์์ฒญํ์ธ์. ์์: "์ ๋ ฅ 5์ ๋ํด ์ด ํจ์์ ์คํ์ ์ถ์ ํ์ธ์. ๊ฐ ์ค ํ์ ๊ฐ ๋ณ์ ๊ฐ์ ๋ณด์ฌ์ฃผ์ธ์."
- 5CoT๋ฅผ ๊ฒ์ฆ ๊ฐ๋ฅํ ์ถ๋ ฅ๊ณผ ๊ฒฐํฉํ์ธ์: ๋ชจ๋ธ์๊ฒ ์์ ์ ๊ฐ์ฌํ ์ ์๋๋ก ๊ณผ์ ์ ๋ณด์ฌ๋ฌ๋ผ๊ณ ์์ฒญํ์ธ์. ๊ฐ ๋จ๊ณ์์ ์ถ๋ก ์ ์ค๋ช ํ์ธ์. ์ค์๋ฅผ ํ๋ฉด, ๋ณด์ฌ์ฃผ๋ ๊ณผ์ ์์ ๋์ ๋์ด์ผ ํฉ๋๋ค.
์ํ ์์: ๋งค์ถ ๊ณ์ฐ
CoT ์์ด๋ ๋ชจ๋ธ์ด ๋จ์ผ ์ต์ข ๋ต๋ณ์ ์ค ์ ์์ต๋๋ค. CoT๋ฅผ ์ฌ์ฉํ๋ฉด ๋ชจ๋ธ์ ๋จ๊ณ๋ณ๋ก ๊ณ์ฐ์ ๋ณด์ฌ์ค๋๋ค.
CoT ์์:
๊ณ ๊ฐ์ด ๊ฐ๋น $15์ 50๊ฐ๋ฅผ ๊ตฌ๋งคํ์ง๋ง 10% ํ ์ธ์ ๋ฐ์ต๋๋ค. ์ผ๋ง๋ฅผ ์ง๋ถํฉ๋๊น?
๋ชจ๋ธ: "$675"
CoT ์์:
๊ณ ๊ฐ์ด ๊ฐ๋น $15์ 50๊ฐ๋ฅผ ๊ตฌ๋งคํ์ง๋ง 10% ํ ์ธ์ ๋ฐ์ต๋๋ค. ๋จ๊ณ๋ณ๋ก ๊ณ์ฐํ์ธ์: 1) ์๊ณ๋ฅผ ๊ณ์ฐํ์ธ์. 2) ํ ์ธ ๊ธ์ก์ ๊ณ์ฐํ์ธ์. 3) ์๊ณ์์ ํ ์ธ์ ๋นผ์ ์ต์ข ๊ฐ๊ฒฉ์ ๊ตฌํ์ธ์.
๋ชจ๋ธ: "1) ์๊ณ = 50 ร $15 = $750. 2) ํ ์ธ = $750์ 10% = $75. 3) ์ต์ข ๊ฐ๊ฒฉ = $750 โ $75 = $675."
๋ ๊ฒฝ์ฐ ๋ชจ๋ ๊ฐ์ ๋ต๋ณ์ ์ ์ํ์ง๋ง, CoT ๋ฒ์ ์ ์ํ์ ๋ณผ ์ ์๊ณ ์ค๋ฅ๋ฅผ ๋ฐ๊ฒฌํ ์ ์์ต๋๋ค (์: ๋๊ตฐ๊ฐ $750์ 10%๋ฅผ ์๋ชป ๊ณ์ฐํ์ ๊ฒฝ์ฐ).
CoT vs. ๋ด์ฅ ์ถ๋ก ๋ชจ๋ธ (2026)
2026๋ ์๋ Claude Opus 4.8, OpenAI o3, Gemini Deep Think ๊ฐ์ ์ต์ ์ ๋ชจ๋ธ๋ค์ด chain-of-thought๋ฅผ ์๋์ผ๋ก ๋ด๋ถํํ๋ ๋ด์ฅ ์ถ๋ก ๋ชจ๋๋ฅผ ๊ฐ์ถ๊ณ ์์ต๋๋ค. ์ด๋ฌํ ๋ชจ๋ธ์๋ ๋จ๊ณ๋ณ๋ก ์๊ฐํด๋ผ๋ ์ง์๋ฅผ ์ถ๊ฐํ ํ์๊ฐ ์์ต๋๋ค.
ํ๋กฌํํธ ์์ค CoT๋ฅผ ์ฌ์ฉํด์ผ ํ ๋: ๋น์ถ๋ก ๋ชจ๋ธ (Claude Haiku 4.5, GPT-5.5 mini, Gemini Flash, Llama 4), ๋ก์ปฌ LLM, ๋๋ ์ถ๋ก ํ ํฐ ์์ฐ์ ์ถ๊ฐ ๋น์ฉ์ ํผํ๊ณ ์ถ์ ๋.
๋ด์ฅ ์ถ๋ก ๋ชจ๋๋ฅผ ์ฌ์ฉํด์ผ ํ ๋: ์ต์ ์ ๋ชจ๋ธ์์ ์ต๊ณ ์ ํ๋, ์ํ ์ง์ฝ์ ์์ , ๋ณต์กํ ๋ถ์์ด ํ์ํ ๋. ์ด๋ฌํ ๋ชจ๋ธ์ ์ถ๋ก ํ ํฐ์ ๋ณ๋๋ก ์ฒญ๊ตฌํฉ๋๋ค (์ผ๋ฐ์ ์ผ๋ก ์ถ๋ ฅ ํ ํฐ๋ณด๋ค ๋์ ์๊ธ). ํ๋ก๋์ ๋ฐฐํฌ ์ ์ Anthropic ์ฝ์ ๋๋ OpenAI ํ๋ ์ด๊ทธ๋ผ์ด๋์์ CoT ํ๋กฌํํธ๋ฅผ ํ ์คํธํ์ธ์.
| ๋ฐฉ์ | ์ต์ ์ฌ์ฉ ์ฌ๋ก | ๋น์ฉ | ํฌ๋ช ์ฑ | ๋ชจ๋ธ |
|---|---|---|---|---|
| ํ๋กฌํํธ ์์ค CoT ("๋จ๊ณ๋ณ๋ก ์๊ฐํด") | ์ํ ๋ชจ๋ธ, ๋ก์ปฌ LLM, ๋น์ฉ์ ๋ฏผ๊ฐํ ์์ | ์ถ๋ ฅ ํ ํฐ ์ฆ๊ฐ | ์์ : ์ถ๋ ฅ์ ๋จ๊ณ๊ฐ ๋ณด์ | Haiku, Flash, LLaMA, Qwen |
| Claude extended thinking (Opus 4.8, Sonnet 4.6) | ๋ณต์กํ ๋ถ์, ์ต๊ณ ์ ํ๋ | ๋ณ๋ ์ฌ๊ณ ํ ํฐ ์์ฐ (์ ๋ ฅ ์๊ธ) | API๋ฅผ ํตํ ๊ฒ์ฌ๊ธฐ ์ถ์ | Claude Opus 4.8, Claude Sonnet 4.6 |
| OpenAI o3 | ๊ฐ์ฅ ์ด๋ ค์ด ๋ฌธ์ (์ํ, ์ฝ๋, ๊ฒฝ์) | ์ถ๋ก ํ ํฐ ์์ฐ (์ต๊ณ ์์ค) | ์ถ๋ก ์จ๊น, ์ถ๋ ฅ๋ง ๋ณด์ | OpenAI o3 |
| Gemini Deep Think | Google Cloud ํตํฉ, Gemini ์ํ๊ณ | ์ถ๋ ฅ๊ณผ ๋ณ๋์ ์ฌ๊ณ ํ ํฐ | thinking_level ํ๋ผ๋ฏธํฐ (LOW, MEDIUM, HIGH) | Gemini 3.1 Pro |
| DeepSeek R1 | ์คํ ๊ฐ์ค์น ์ต์ , ์จ๋๋ฐ์ด์ค ์ถ๋ก | ์ถ๋ ฅ ํ ์คํธ๋ก ์ถ๋ก ์คํธ๋ฆฌ๋ฐ | ์์ : ์ถ๋ ฅ์ CoT ์ธ๋ผ์ธ | DeepSeek R1 |
๐ก ์ ๋ฌธ๊ฐ ํ
๋น์ฉ์ ๊ณ ๋ คํ์ฌ ๊ฐ๋ฐํ๋ค๋ฉด ๋ ์์ ๋ชจ๋ธ์์ ํ๋กฌํํธ ์์ค CoT๋ฅผ ์ฌ์ฉํ์ธ์. ์ด๋ ค์ด ๋ฌธ์ ์์ ์ ํ๋๋ฅผ ์ํด ๊ฐ๋ฐํ๋ค๋ฉด o3 ๋๋ Claude extended thinking์ ์ฌ์ฉํ๊ณ ์ถ๋ก ์ ๋ชจ๋ธ์๊ฒ ๋งก๊ธฐ์ธ์.
Chain-of-thought์ ๋ณํ ๋ฐ ํ์ฅ
๊ธฐ๋ณธ ๋จ๊ณ๋ณ๋ก ์๊ฐํด ํจํด์ ๋์ด, ์ฐ๊ตฌ์๋ค์ ์๋ก ๋ค๋ฅธ ์ ํ์ ๋ฌธ์ ์ ์ต์ ํ๋ ์ฌ๋ฌ CoT ๋ณํ์ ๊ฐ๋ฐํ์ต๋๋ค.
- Zero-shot CoT: ์์ ์์ด ๋จ๊ณ๋ณ๋ก ์๊ฐํด ๋ด ์๋ค๋ผ๊ณ ์ง๋ฌธํฉ๋๋ค. ๋๋ถ๋ถ์ ๋ชจ๋ธ์์ ์๋ํ๋ฉฐ ๊ตฌํ์ด ๊ฐ์ฅ ๊ฐ๋จํฉ๋๋ค. ํฅ์: ์ถ๋ก ์์ ์์ ์ฝ 10~20% ๊ฐ์ .
- Few-shot CoT: ์ถ๋ก ์ด ๋ช ์๋ 2~5๊ฐ์ ํ์ด๋ ์์๋ฅผ ๋ณด์ฌ์ค ๋ค์, ์ ๋ฌธ์ ์ ๊ฐ์ ํจํด์ ์ ์ฉํ๋๋ก ์์ฒญํฉ๋๋ค. Zero-shot๋ณด๋ค ์์ ์ ์ด์ง๋ง ์์๋ฅผ ์๋์ผ๋ก ๋ง๋ค์ด์ผ ํฉ๋๋ค. ํฅ์: ์ ํ๋ ์ฝ 20~40%.
- Self-consistency (Wang ์ธ, 2023): ์ฌ๋ฌ CoT ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ๋ ๋ฆฝ์ ์ผ๋ก ์์ฑํ ๋ค์ ์ต์ข ๋ต๋ณ์ ๋ค์๊ฒฐ์ ์ ์ฉํฉ๋๋ค. ์ค๋ฅ์ ๋ํด ํจ์ฌ ๊ฐ๊ฑดํฉ๋๋ค. ํฅ์: ์ด๋ ค์ด ์์ ์์ ์ฝ 30~50%.
- Tree of Thought (ToT): ์ ํ ์ฒด์ธ ๋์ ์ฌ๋ฌ ์ถ๋ก ๋ถ๊ธฐ๋ฅผ ํ์ํ๊ณ ์ฝํ ๊ฒ์ ์ ๊ฑฐํฉ๋๋ค. ๊ฐ๋ฅํ ํด๊ฒฐ ๊ฒฝ๋ก๊ฐ ๋ง์ ๋ ์ฌ์ฉํ์ธ์ (๊ณํ, ๊ฒ์, ์ฐฝ์์ ์์ ).
- ReAct (์ถ๋ก + ํ๋): ์ถ๋ก ์ ์ธ๋ถ ํ๋ โ API ํธ์ถ, ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ฒ์, ์ฝ๋ ์คํ โ ๊ณผ ๊ต์ฐจํ๊ณ ๊ฒฐ๊ณผ๋ฅผ ๋ค์ ์ถ๋ก ๋จ๊ณ์ ํตํฉํฉ๋๋ค. ์ค์๊ฐ ๋ฐ์ดํฐ๋ ๊ฒ์ฆ์ด ํ์ํ ์ค์ธ๊ณ ์์ ์ ์ด์์ ์ ๋๋ค.
๋ชจ๋ธ ๋น๊ต: 2026๋ CoT ํ๋กฌํํ ์ฒ๋ฆฌ ๋ฐฉ์
| ๋ชจ๋ธ | ํ๋กฌํํธ ์์ค CoT | ๋ด์ฅ ์ถ๋ก | ์ต์ ์ฌ์ฉ ์ฌ๋ก | ๋น์ฉ (์ฝ) |
|---|---|---|---|---|
| Claude Opus 4.8 | ๋ถํ์ | Extended thinking (API๋ฅผ ํตํ ๊ฒ์ฌ ๊ฐ๋ฅํ ์ถ์ ) | ์ต๊ณ ์ ํ๋ ๋ถ์ | ๋์ (์ ๋ ฅ + ์ถ๋ ฅ + ์ฌ๊ณ ํ ํฐ) |
| Claude Sonnet 4.6 | ๋ถํ์ | Extended thinking | ์ ํ๋/๋น์ฉ ๊ท ํ | ์ค๊ฐ |
| Claude Haiku 4.5 | ๊ถ์ฅ | ์์ | ๋น ๋ฅด๊ณ ๊ฒฝ์ ์ ์ธ ์ถ๋ก | ๋ฎ์ |
| OpenAI o3 | ๋ถํ์ | ๋ ธ๋ ฅ ์์ค (low, medium, high, xhigh) | ๊ฒฝ์ ์์ค ๋ฌธ์ | ๋งค์ฐ ๋์ (์ถ๋ก ํ ํฐ ์์ค) |
| GPT-5.5 mini | ๊ถ์ฅ | ์์ | ๊ฒฝ์ ์ ๋ฐฐํฌ | ๋งค์ฐ ๋ฎ์ |
| Gemini 3.1 Pro | ์๋ | Deep Think (thinking_level ํ๋ผ๋ฏธํฐ) | Google Cloud ํตํฉ | ์ค๊ฐ-๋์ |
| Gemini Flash | ๊ถ์ฅ | ์์ | ๋น ๋ฅธ ์๋ต | ๋ฎ์ |
| DeepSeek R1 | ๋ถํ์ | ์ถ๋ ฅ์ ์ธ๋ผ์ธ ์ถ๋ก | ์คํ ๊ฐ์ค์น, ์จ๋๋ฐ์ด์ค | ๋ฌด๋ฃ (์คํ์์ค) |
| Llama 4 | ๊ถ์ฅ | ์์ | ๋ก์ปฌ ๋ฐฐํฌ, ๊ฐ์ธ์ ๋ณด ๋ณดํธ | ์ ํํธ์คํ (์ปดํจํ ์ ๋ฐ๋ผ ๋ค๋ฆ) |
๊ด๋ จ ์๋ฃ
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
Chain-of-thought๋ ๋ชจ๋ ๋ชจ๋ธ์์ ์๋ํฉ๋๊น?
Chain-of-thought๋ 7B+ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๋๋ถ๋ถ์ ๋ชจ๋ธ์์ ์๋ํ์ง๋ง ์ด์ ์ ๋ค์ํฉ๋๋ค. ์ค์ํ ๋ชจ๋ธ (Haiku, Flash, Llama 4)์์ ๊ฐ์ฅ ํจ๊ณผ์ ์ ๋๋ค. ์ต์ ์ ๋ชจ๋ธ (Claude Opus 4.8, o3)์์๋ ๋ด์ฅ ์ถ๋ก ๋ชจ๋๊ฐ ํ๋กฌํํธ ์์ค CoT๋ณด๋ค ๋ ํจ์จ์ ์ธ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
Chain-of-thought๋ ๋น์ฉ์ ์ฆ๊ฐ์ํต๋๊น?
์, ํ๋กฌํํธ ์์ค CoT๋ ์ถ๋ ฅ ํ ํฐ ์๋ฅผ ์ฆ๊ฐ์ํต๋๋ค (๋ชจ๋ธ์ด ์ต์ข ๋ต๋ณ ์ ์ ์ถ๋ก ์ ์์ฑํ๊ธฐ ๋๋ฌธ). ๋ด์ฅ ์ถ๋ก ๋ชจ๋ (Claude extended thinking, OpenAI o3)๋ ๋ณ๋์ ์ฒญ๊ตฌ ์๊ธ์ด ์๋ ๋ณ๋์ ์ฌ๊ณ ํ ํฐ ์์ฐ์ ์ฌ์ฉํฉ๋๋ค. ๋น์ฉ/์ ํ๋ ํธ๋ ์ด๋์คํ๋ฅผ ๋น๊ตํ๊ธฐ ์ํด ์ฌ์ฉ ์ฌ๋ก์์ ๋ ๊ฐ์ง๋ฅผ ๋ชจ๋ ํ ์คํธํ์ธ์.
์ธ์ zero-shot ๋์ few-shot CoT๋ฅผ ์ฌ์ฉํด์ผ ํฉ๋๊น?
๋จผ์ zero-shot CoT๋ฅผ ์ฌ์ฉํ์ธ์ โ ๋ ๊ฐ๋จํ๊ณ ๋๋ถ๋ถ์ ๊ฒฝ์ฐ์ ์๋ํฉ๋๋ค. zero-shot์ด ์ ๋ขฐํ ์ ์๊ฑฐ๋ ๋๋ฉ์ธ์ ํน์ ์ถ๋ก ํจํด์ด ํ์ํ ๊ฒฝ์ฐ (์: ํ์ค ๋ผ์ธ ๊ตฌ์กฐ์ ์ฌ๋ฌด ๋ถ์) few-shot (์์ 2~5๊ฐ)์ผ๋ก ์ ํํ์ธ์.
Chain-of-thought๋ฅผ ๊ตฌ์กฐํ๋ ์ถ๋ ฅ(JSON)๊ณผ ๊ฒฐํฉํ ์ ์์ต๋๊น?
์. ๋ชจ๋ธ์๊ฒ ๋จผ์ ์ผ๋ฐ ํ ์คํธ๋ก ์ถ๋ก ์ ๋ณด์ฌ์ค ๋ค์ ์ต์ข ๋ต๋ณ์ด ์๋ JSON ๊ฐ์ฒด๋ฅผ ์์ฑํ๋๋ก ์์ฒญํ ์ ์์ต๋๋ค. ์ง์๋ฅผ ๊ฒฐํฉํ์ธ์: ๋จ๊ณ๋ณ๋ก ์๊ฐํ์ธ์. ๊ทธ๋ฐ ๋ค์ ๊ฒฐ๊ณผ๋ฅผ ์ ํจํ JSON์ผ๋ก ์์ฑํ์ธ์. ์ด๊ฒ์ ํ๋ก๋์ ์์คํ ์์ ์ผ๋ฐ์ ์ ๋๋ค.
Chain-of-thought์ tree-of-thought์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
Chain-of-thought๋ ์ ํ ์์์ ๋๋ค: 1๋จ๊ณ โ 2๋จ๊ณ โ ... โ ๊ฒฐ๋ก . Tree-of-thought๋ ์ฌ๋ฌ ๋ถ๊ธฐ (๋์์ ์ถ๋ก ๊ฒฝ๋ก)๋ฅผ ํ์ํ๊ณ ๋ต๋ณ์ ๋๋ฌํ๊ธฐ ์ ์ ๋ ์ฝํ ๊ฒ์ ์ ๊ฑฐํฉ๋๋ค. Tree-of-thought๋ ๋ ๊ฐ๋ ฅํ์ง๋ง ๋น์ฉ์ด ๋ ๋ง์ด ๋ญ๋๋ค (์ฌ๋ฌ ๋ชจ๋ธ ํธ์ถ ํ์).
OpenAI o3๋ chain-of-thought ํ๋กฌํํ ์ด ํ์ํฉ๋๊น?
์๋๋๋ค. OpenAI o3๋ ์๋์ผ๋ก ํ์ฑํ๋๋ ๋ด์ฅ ์ถ๋ก ๊ธฐ๋ฅ์ ๊ฐ์ถ๊ณ ์์ต๋๋ค. ๋จ๊ณ๋ณ๋ก ์๊ฐํด ์ง์๋ฅผ ์ถ๊ฐํ ํ์๊ฐ ์์ต๋๋ค. o3์ ๋ฌธ์ ๋ฅผ ์ ์ํ๊ณ ์ง์ถํ ์ถ๋ก ์์ฐ์ ์ ์ดํ๊ธฐ ์ํด ๋ ธ๋ ฅ ์์ค (low/medium/high/xhigh)์ ์ค์ ํ๊ธฐ๋ง ํ๋ฉด ๋ฉ๋๋ค.
๋ด์ฅ ์ถ๋ก ๋ชจ๋ธ์ ์ถ๋ก ์ ๊ฐ์ฌํ ์ ์์ต๋๊น?
์, ํ์ง๋ง ๋ชจ๋ธ์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค. Claude extended thinking์ ์ถ๋ก ์ถ์ ์ API๋ฅผ ํตํด ๊ฒ์ฌํ ์ ์์ต๋๋ค. OpenAI o3์ ์ถ๋ก ์ ๊ธฐ๋ณธ์ ์ผ๋ก ์จ๊ฒจ์ ธ ์์ต๋๋ค (๊ฒฝ์ ์ฐ์๋ฅผ ์ํด). Gemini Deep Think์ ์ถ๋ก ๋ ์จ๊ฒจ์ ธ ์์ต๋๋ค. ์์ ํ ๊ฐ์ฌ ๊ฐ๋ฅ์ฑ์ ์ํด์๋ ํ๋กฌํํธ ์์ค CoT ๋๋ DeepSeek R1์ ์ฌ์ฉํ์ธ์.
Chain-of-thought ํ๋กฌํํ ์ ์ค์๊ฐ ์ ํ๋ฆฌ์ผ์ด์ ์ ์ ํฉํฉ๋๊น?
ํ๋กฌํํธ ์์ค CoT๋ ์ง์ฐ ์๊ฐ์ ์ฆ๊ฐ์ํต๋๋ค (์ถ๋ ฅ ํ ํฐ์ด ๋ ๋ง์ผ๋ฉด ์์ฑ์ด ๋๋ ค์ง). ์ค์๊ฐ ์ฌ์ฉ ์ฌ๋ก์ ๊ฒฝ์ฐ ์ต์ ์ถ๋ก ์ด ์๋ ์ํ ๋ชจ๋ธ์ ์ฌ์ฉํ๊ฑฐ๋ ํ ํฐ์ด ๋ค์ด์ฌ ๋ ๋ณด์ฌ์ฃผ๊ธฐ ์ํด ์คํธ๋ฆฌ๋ฐ ์๋ํฌ์ธํธ๋ฅผ ์ฌ์ฉํ์ธ์. ๋ด์ฅ ์ถ๋ก ๋ชจ๋๋ ๋ ๋ง์ ์ง์ฐ ์๊ฐ์ ์ถ๊ฐํ ์ ์์ต๋๋ค; ํน์ ์ฌ์ฉ ์ฌ๋ก๋ฅผ ๋ฒค์น๋งํฌํ์ธ์.
์ถ์ฒ ๋ฐ ์ถ๊ฐ ์๋ฃ
- Wei, J., Wang, X., Schuurmans, D., et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." NeurIPS 2022. arXiv:2201.11903
- Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). "Large Language Models are Zero-Shot Reasoners." NeurIPS 2022. arXiv:2205.11916
- Wang, X., Wei, J., Schuurmans, D., et al. (2023). "Self-Consistency Improves Chain of Thought Reasoning in Language Models." ICLR 2023. arXiv:2203.11171
- Anthropic. (2024). "Extended Thinking in Claude." Claude Opus 4.8 ๋ฐ Sonnet 4.6์ ์ถ๋ก ๊ธฐ๋ฅ์ ๊ดํ ๊ธฐ์ ๋ฌธ์.
- OpenAI. (2026). "OpenAI o3: Reasoning Models for Competition-Level Problem Solving." OpenAI ๋ฌธ์ ๋ฐ ์ฐ๊ตฌ.