APE ํ๋ ์์ํฌ๋ ๋ฌด์์ธ๊ฐ
APE ํ๋ ์์ํฌ๋ ์ธ์ด ๋ชจ๋ธ์ด ์ฌ๊ณ ๋ฅผ ๋ถ์, ๊ณํ, ์คํ์ผ๋ก ๋ถ๋ฆฌํ๋๋ก ๊ฐ์ ํ๋ ํ๋กฌํํธ ํ ํ๋ฆฟ์ ๋๋ค. ๋จ์ผ ์๋ต์ ๋ฐ๋ ๋์ ๋ชจ๋ธ์ด ๋ฌธ์ ๋ฅผ ์ด๋ป๊ฒ ์ดํดํ๋์ง, ์ด๋ป๊ฒ ํด๊ฒฐํ๋ ค๋์ง, ์ต์ข ๊ฒฐ๊ณผ๋ฌผ์ด ๋ฌด์์ธ์ง ํ์ธํ ์ ์์ต๋๋ค. ์ด ๊ตฌ์กฐ๋ ๊ฐ ๋จ๊ณ๋ฅผ ๊ฒ์ฌํ ์ ์๊ธฐ ๋๋ฌธ์ ์ ๋ขฐ์ฑ์ ํฅ์์ํต๋๋ค.
๋ณต์กํ๊ฑฐ๋ ์ํ๋๊ฐ ๋์ ์์ ์ ์ฒ๋ฆฌํ ๋ APE๋ ํนํ ์ ์ฉํฉ๋๋ค. ๋ชจ๋ธ์๊ฒ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ๋ช ์์ ์ผ๋ก ๋ณด์ฌ๋ฌ๋ผ๊ณ ์์ฒญํจ์ผ๋ก์จ ์จ๊ฒจ์ง ๊ฐ์ ์ด๋ ์ง๋ฆ๊ธธ์ด ๋ณด์ด์ง ์๊ฒ ๋จ์์์ ๊ฐ๋ฅ์ฑ์ ์ค์ ๋๋ค. ๋์ผํ ์ธ ๋ถ๋ถ ํจํด์ด ๋ชจ๋ ๋ชจ๋ธ์์ ์๋ํฉ๋๋ค โ ํด๋ผ์ฐ๋ API์ Ollama ๋๋ LM Studio๋ฅผ ํตํ ๋ก์ปฌ ๋ชจ๋ธ โ ์ผ๊ด๋ ๊ฒฐ๊ณผ๋ฅผ ์ ์งํฉ๋๋ค.
์ธ ๋จ๊ณ: ๋ถ์, ๊ณํ, ์คํ
APE ํ๋ ์์ํฌ์ ํต์ฌ์ ๊ฐ ํ๋กฌํํธ๊ฐ ๋ชจ๋ธ์๊ฒ ๋จผ์ ๋ฌธ์ ๋ฅผ ๋ถ์ํ๊ณ , ๊ทธ ๋ค์ ํด๊ฒฐ์ฑ ์ ๊ณํํ๊ณ , ๊ทธ๋ฐ ๋ค์์์ผ ์ต์ข ๋ต๋ณ์ ์คํํ๋๋ก ์ง์ํ๋ค๋ ๊ฒ์ ๋๋ค. ์ด ์ธ ๋จ๊ณ๋ ์ธ๊ฐ์ด ์ถ๋ก ์ ์ฒ๋ฆฌํ๋ ๋ฐฉ์์ ์ง์ ์ ์ผ๋ก ๋์ํ๋ฉฐ ๋ช ํํ ๊ฒ์ฌ ํฌ์ธํธ๋ฅผ ์ ๊ณตํฉ๋๋ค.
์ผ๋ฐ์ ์ธ ๋ถ๋ฅ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ๋ถ์(Analyze): ์์ ์ ์์ ์ ๋ง๋ก ์ฌ๊ตฌ์ฑํ๊ณ , ์ฃผ์ ์ ์ฝ ์กฐ๊ฑด์ ํ์ ํ๊ณ , ๋๋ฝ๋ ์ ๋ณด๋ฅผ ๋ฐ๊ฒฌํฉ๋๋ค.
- ๊ณํ(Plan): ์์ ์ ํด๊ฒฐํ๊ธฐ ์ํด ๋ฐ๋ฅผ ๋จ๊ณ๋ณ ๊ฐ๋ตํ ์ ๊ทผ ๋ฐฉ์์ ์ ์ํฉ๋๋ค.
- ์คํ(Execute): ์์ฒญ๋ ๊ตฌ์กฐ์ ํ์์ ๋ฐ๋ผ ๊ณํ์ ๋ฐ๋ฅด๋ฉฐ ์ต์ข ๋ต๋ณ์ ์์ฑํฉ๋๋ค.
APE ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํด์ผ ํ ๋
์์ ์ด ์ถฉ๋ถํ ๋ณต์กํ์ฌ ์ต์ข ๊ฒฐ๊ณผ๋ฌผ๋ฟ๋ง ์๋๋ผ ๋ชจ๋ธ์ ์ถ๋ก ๊ณผ์ ์๋ ๊ด์ฌ์ ๊ฐ๊ฒ ๋ ๋ APE ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํด์ผ ํฉ๋๋ค. ์ฌ๊ธฐ์๋ ๊ธฐ์ ๋ถ์, ๋ค๋จ๊ณ ์ฐ๊ตฌ, ์ ๋ต์ ์์ฑ, ๊ทธ๋ฆฌ๊ณ ์ค๋ฅ๊ฐ ๋น์ฉ์ ์ด๋ํ๋ ๋ชจ๋ ์ํฉ์ด ํฌํจ๋ฉ๋๋ค.
์ผ๋ฐ์ ์ธ ์ฌ์ฉ ์ฌ๋ก๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ์ ํ ์๊ตฌ์ฌํญ์ ์ฌ์ฉ์ ์คํ ๋ฆฌ์ ์๋ฝ ๊ธฐ์ค์ผ๋ก ๋ถ๋ฅํ๊ธฐ.
- ์์ ๋ฉ๋ชจ์ ์์ฅ ์ ๋ณด๋ก๋ถํฐ ์ฝํ ์ธ ์ ๋ต ์ค๊ณํ๊ธฐ.
- ํธ๋ ์ด๋์คํ์ ์ํ์ ์ค๋ช ํ๋ฉฐ ์ฝ๋ ๊ฒํ ๋ฐ ๋ฆฌํฉํ ๋งํ๊ธฐ.
- ๊ตฌ์กฐ๊ฐ ๋ด์ฉ๋งํผ ์ค์ํ ์ฅ๋ฌธ์ ๋ณด๊ณ ์ ๊ณํ ๋ฐ ์์ฑํ๊ธฐ.
โ ๏ธ ๊ฒฝ๊ณ
APE๋ ํ ํฐ ์ค๋ฒํค๋๋ฅผ ์ถ๊ฐํฉ๋๋ค โ ๋ถ์ ๋ฐ ๊ณํ ๋จ๊ณ๋ ์ต์ข ์คํ ์ ์ ์ถ๋ ฅ ํ ํฐ์ ์๋นํฉ๋๋ค. ์ถ๋ก ์ ๊ฒ์ฌํ์ง ์๊ณ ์ต์ข ๋ต๋ณ๋ง ํ์ํ ๋๋ ํ๋ก๋์ ์์ ์ ๊ฒฝ์ฐ, ๋น์ฉ๊ณผ ์ง์ฐ ์๊ฐ์ ์ค์ด๊ธฐ ์ํด ๋ ๋จ์ํ ๋จ์ผ ๋จ๊ณ ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ญ์์ค.
APE ํ๋กฌํํธ ์์ฑ ๋ฐฉ๋ฒ
ํจ๊ณผ์ ์ธ APE ํ๋กฌํํธ๋ ์ธ ๋จ๊ณ๋ฅผ ์ด๋ฆ์ผ๋ก ์ธ๊ธํ๊ณ ๊ฐ ๋ถ๋ถ์์ ๊ธฐ๋ํ๋ ๊ฒ์ ๋ช ์ํฉ๋๋ค: ๋ถ์ ๋ฉ๋ชจ, ๋จ๊ณ๋ณ ๊ณํ, ์ต์ข ๊ฒฐ๊ณผ๋ฌผ. ๋จ์ผ ํ๋กฌํํธ๋ก ๊ณ์ฐ๋ ์ ์๋๋ก ๊ฐ๊ฒฐํ๊ฒ ์์ฑํ ์ ์์ต๋๋ค.
์ผ๋ฐ์ ์ธ ํจํด์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
"๋น์ ์ ์ญํ ์ ๋๋ค. ๋จผ์ , ์ฃผ์ ๋ชฉํ, ์ ์ฝ ์กฐ๊ฑด ๋ฐ ๋๋ฝ๋ ์ ๋ณด๋ฅผ ๋์ดํ์ฌ ์์ ์ ๋ถ์ํ์ญ์์ค. ๊ทธ๋ฐ ๋ค์, 3-5๊ฐ์ ์์ ์ผ๋ก ์ ๊ทผ ๋ฐฉ์์ ๊ณํํ์ญ์์ค. ๋ง์ง๋ง์ผ๋ก, ๊ณํ์ ์๊ฒฉํ ๋ฐ๋ฅด๋ฉฐ ์ํ๋ ๊ฒฐ๊ณผ ํ์์ ์์ฑํ์ฌ ์คํํ์ญ์์ค."
๊ทธ๋ฐ ๋ค์ ์ด ๊ธฐ๋ณธ ํจํด์ ๋์ ๋ ์, ํค, ํ์ผ ๊ตฌ์กฐ ๋๋ ์ธ์ฉ ์๊ตฌ์ฌํญ๊ณผ ๊ฐ์ ๋๋ฉ์ธ ์ธ๋ถ ์ฌํญ์ผ๋ก ์ปค์คํฐ๋ง์ด์ฆํ ์ ์์ต๋๋ค. ํ ๋ฒ ์ ์๋๋ฉด ๋ชฉํ์ ์ปจํ ์คํธ๋ง ๋ณ๊ฒฝํ์ฌ ์ฌ๋ฌ ์์ ์์ ๋์ผํ APE ํ๋กฌํํธ๋ฅผ ์ฌ์ฌ์ฉํ ์ ์์ต๋๋ค.
๐ ํ๋ก ํ
๋ชจ๋ธ์ด ๋ถ์๊ณผ ๊ณํ์ ์๋ฃํ ํ, ์คํ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๊ธฐ ์ ์ ๋จผ์ ์ฝ์ผ์ญ์์ค. ๋ถ์์์ ์ ์ฝ ์กฐ๊ฑด์ด ๋๋ฝ๋์๊ฑฐ๋ ๊ณํ์ ์๋ชป๋ ๋จ๊ณ๊ฐ ์๋ค๋ฉด ๋ชจ๋ธ์๊ฒ ์์ ์ ์์ฒญํ์ญ์์ค โ ์ด๊ฒ์ด ์ ์ฒด ๋ต๋ณ์ ์ฌ์์ฑํ๋ ๊ฒ๋ณด๋ค ๋ ์ ๋ ดํ๊ณ ๋น ๋ฆ ๋๋ค.
์์: ๋์ APE ํ๋กฌํํธ vs ์ข์ APE ํ๋กฌํํธ
๋น๊ตฌ์กฐํ๋ ํ๋กฌํํธ์ APE ํ๋กฌํํธ์ ์ฐจ์ด๋ ๋์ผํ ์์ ์์ ๋น๊ตํ ๋ ๋ช ํํด์ง๋๋ค. ์ ํ ์ถ์ ์ด๋ฉ์ผ์ ๋ํ ๊ฐ๋จํ ์์์ ๋๋ค.
๋์ ํ๋กฌํํธ
"์๋ก์ด ๋ถ์ ๋์๋ณด๋๋ฅผ ๋ฐํํ๋ ์ด๋ฉ์ผ์ ์์ฑํ์ธ์."
์ข์ ํ๋กฌํํธ
"๋น์ ์ SaaS ์ ํ ๋ง์ผํ ์ ๋ฌธ๊ฐ์ ๋๋ค. ๋ชฉํ: ๊ธฐ์กด ๊ณ ๊ฐ์ ๋์์ผ๋ก ์๋ก์ด ๋ถ์ ๋์๋ณด๋ ๋ฐํ ์ด๋ฉ์ผ ์์ฑ. APE ๊ตฌ์กฐ: 1) ๋ถ์: ๋์ ๋ ์, ์ฃผ์ ๋ถํธ ์ฌํญ, ์ด ๋์๋ณด๋๊ฐ ํด๊ฒฐํ๋ ํต์ฌ ์ด์ ์ ๊ฐ๋ตํ ๋์ดํ์ญ์์ค. 2) ๊ณํ: ์ด๋ฉ์ผ ๊ตฌ์กฐ๋ฅผ 3-5๊ฐ์ ์์ (ํ , ํต์ฌ ์ด์ , ํ๋ ์ ๋ ๋ฑ)์ผ๋ก ๊ฐ์๋ฅผ ์ก์ผ์ญ์์ค. 3) ์คํ: ๋ช ํํ๊ณ ์ ๋ฌธ์ ์ธ ํค์ผ๋ก ์ต์ข ์ด๋ฉ์ผ(์ต๋ 220๋จ์ด)์ ์์ฑํ์ญ์์ค. ์ ๋ชฉ ์ค, ๋ฏธ๋ฆฌ๋ณด๊ธฐ ํ ์คํธ ๋ฐ ๋ณธ๋ฌธ์ ํฌํจํ์ญ์์ค."
APE ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํ๋ฉด ๋ชจ๋ธ์ด ์ด๋ฉ์ผ์ ์์ฑํ๊ธฐ ์ ์ ๋ฌธ์ ์ดํด์ ๊ณํ์ ๋ณด์ฌ์ฃผ๋ฏ๋ก ์ด๊ธฐ์ ๋ถ์ผ์น๋ฅผ ๋ฐ๊ฒฌํ๊ธฐ๊ฐ ๋ ์ฝ์ต๋๋ค.
PromptQuorum์ด APE ํ๋ ์์ํฌ๋ฅผ ๊ตฌํํ๋ ๋ฐฉ๋ฒ
PromptQuorum์ APE ํ๋ ์์ํฌ๋ฅผ ๋ด์ฅ ํ๋กฌํํธ ๊ตฌ์กฐ ์ค ํ๋๋ก ํฌํจํ๋ ๋ค์ค ๋ชจ๋ธ AI ๋์คํจ์น ๋๊ตฌ๋ก, ์ฌ์ฉ์๊ฐ ํด๋ฆญ ํ ๋ฒ์ผ๋ก ๋ถ์-๊ณํ-์คํ ํ๋กฌํํ ์ ์ ์ฉํ ์ ์์ต๋๋ค. PromptQuorum์์ APE ์ต์ ์ ์ ํํ๋ฉด ์ ํ๋ฆฌ์ผ์ด์ ์ด ๋ชฉํ์ ์ปจํ ์คํธ ์ฃผ์์ ์ธ ๋จ๊ณ ๊ตฌ์กฐ๋ฅผ ์๋์ผ๋ก ์ฝ์ ํฉ๋๋ค.
PromptQuorum ๋ด์์ APE ํ๋ ์์ํฌ๋:
- ๋ถ์, ๊ณํ ๋ฐ ์คํ ๊ธฐ๋์น์ ๋ํ ๋ ์ด๋ธ์ด ์ง์ ๋ ์น์ ์ ์ ๊ณตํ์ฌ ๋งค๋ฒ ํจํด์ ๊ธฐ์ตํ ํ์๊ฐ ์์ต๋๋ค.
- ๋์ผํ APE ๊ตฌ์กฐํ๋ ํ๋กฌํํธ๋ฅผ ์ฌ๋ฌ ๋ชจ๋ธ์ ๋ณ๋ ฌ๋ก ์ ์กํ์ฌ ๊ฐ ๋จ๊ณ์์ ๋ค๋ฅธ ๋ชจ๋ธ์ด ์ด๋ป๊ฒ ์๋ตํ๋์ง ๋น๊ตํ๊ธฐ ์ฝ์ต๋๋ค.
- ์ฝ๋ ๋ฆฌ๋ทฐ, ์ ๋ต ๋ฉ๋ชจ ๋๋ ์ฐ๊ตฌ ๋ณด๊ณ ์์ ๊ฐ์ ๋ฐ๋ณต์ ์ธ ์ํฌํ๋ก์ฐ๋ฅผ ์ํ ํ ํ๋ฆฟ์ผ๋ก ์ ์ฅํ ์ ์์ต๋๋ค.
APE vs ๋ค๋ฅธ ํ๋ ์์ํฌ ์ ํํ๊ธฐ
๋ช ์์ ์ธ ์ถ๋ก ๋จ๊ณ๋ฅผ ์ํ์ง๋ง ๋ง์ ๋งค๊ฐ๋ณ์๋ ์น์ ์ด ํ์ํ์ง ์์ ๋ ๋ค๋ฅธ ํ๋กฌํํธ ํ๋ ์์ํฌ๋ณด๋ค APE ํ๋ ์์ํฌ๋ฅผ ์ ํํด์ผ ํฉ๋๋ค. APE๋ ์๋์ ์ผ๋ก ๊ฐ๊ฒฐํฉ๋๋ค: ์ธ ๋จ๊ณ๋ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ์๋ฅผ ์๋ํ์ง ์๊ณ ๋ช ํ์ฑ์ ํฅ์์ํค๊ธฐ์ ์ถฉ๋ถํฉ๋๋ค.
์ค์ ๋ก๋:
- ์ถ๋ก ์ด ์ค์ํ ๋ณต์กํ์ง๋ง ๋ ๋ฆฝ์ ์ธ ์์ ์๋ APE๋ฅผ ์ ํํ์ญ์์ค.
- ๊ฒฐ๊ณผ ํ์์ ์ ํํ ์๊ณ ์๊ณ ์ ๋ช ์ธ๋ ์ง์๋ง ํ์ํ ๋๋ ๋จ์ผ ๋จ๊ณ ํ๋ ์์ํฌ๋ฅผ ์ ํํ์ญ์์ค.
- ํ๋กฌํํธ์ ์ธ์ฝ๋ฉํด์ผ ํ๋ ์๊ฒฉํ ๋ด๋ถ ํ์ค์ด ์์ ๋๋ง ๋ ์์ธํ ํ๋ ์์ํฌ(๋ง์ ์น์ ๊ณผ ๋งค๊ฐ๋ณ์๊ฐ ์๋)๋ฅผ ์ ํํ์ญ์์ค.
| ํ๋ ์์ํฌ | ๋จ๊ณ/์น์ | ์ ํฉํ ๊ฒฝ์ฐ | ์ถ๋ก ๊ฐ์์ฑ? |
|---|---|---|---|
| APE | 3 (๋ถ์, ๊ณํ, ์คํ) | ๊ฒ์ฌ ๊ฐ๋ฅํ ์ถ๋ก ์ด ํ์ํ ๋ณต์กํ ์์ | ์ โ ๋ช ์์ ๋จ๊ณ |
| Single-Step | 1 (๋จ์ผ ์ง์) | ์ ์ ์๋ ๋จ์ํ ์์ | ์๋์ค |
| CRAFT | 5 (์ปจํ ์คํธ, ์ญํ , ํ๋, ํ์, ๋ชฉํ) | ์์ ํ ์ปจํ ์คํธ ์ ์ | ์ ํ์ |
| CO-STAR | 6 (์ปจํ ์คํธ, ๋ชฉํ, ์คํ์ผ, ํค, ๋์, ์๋ต) | ๋ง์ผํ ๋ฐ ์ปค๋ฎค๋์ผ์ด์ | ์๋์ค |
| SPECS | 5 (์ํฉ, ๋ฌธ์ , ์์, ์ ์ฝ, ์คํ์ผ) | ์์๋ฅผ ํ์ฉํ ๋ฌธ์ ํด๊ฒฐ | ์ ํ์ |
| Chain-of-Thought | 1 ("๋จ๊ณ์ ์ผ๋ก ์๊ฐํ์ธ์" ํฌํจ) | ์ํ, ๋ ผ๋ฆฌ, ๋จ์ผ ๋จ๊ณ ์ถ๋ก | ์ โ ํ์ง๋ง ๊ตฌ์กฐ ์์ |
๐ ์๊ณ ๊ณ์ จ๋์?
APE์ ์ธ ๋จ๊ณ ๊ตฌ์กฐ๋ ์ ๋ฌธ๊ฐ๊ฐ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ์ ๊ทผํ๋ ๋ฐฉ์๊ณผ ์ง์ ์ ์ผ๋ก ๋์ํฉ๋๋ค: ๋ฌธ์ ์ดํด(๋ถ์), ์ ๊ทผ ๋ฐฉ์ ์ค๊ณ(๊ณํ), ๊ฒฐ๊ณผ๋ฌผ ์์ฑ(์คํ). ์ธ์ง ๊ณผํ ์ฐ๊ตฌ์ ๋ฐ๋ฅด๋ฉด ์ด๋ฌํ ๋ถ๋ฆฌ๋ ์ธ๊ฐ๊ณผ AI ์ถ๋ก ๋ชจ๋์์ ์ค๋ฅ๋ฅผ ์ค์ ๋๋ค.
APE๋ ๋ํ ์๋ฏธํฉ๋๋ค: ์๋ ํ๋กฌํํธ ์์ง๋์ด๋ง (๋ค๋ฅธ ๊ฐ๋ )
"APE"๋ ์์ ์ค๋ช ๋ ๋ถ์-๊ณํ-์คํ ํ๋ ์์ํฌ์๋ ๋ณ๊ฐ์ ๊ธฐ์ ์ธ ์๋ ํ๋กฌํํธ ์์ง๋์ด๋ง(Automatic Prompt Engineering)์ ์ง์นญํ๋ ๋ฐ๋ ์ฌ์ฉ๋ฉ๋๋ค. ์๋ ํ๋กฌํํธ ์์ง๋์ด๋ง(Zhou et al., 2022)์ AI๋ฅผ ์ฌ์ฉํ์ฌ ํ๋กฌํํธ ๋ณํ์ ์๋์ผ๋ก ์์ฑํ๊ณ ์ ์๋ฅผ ๋งค๊ฒจ ์๋ ์ํ์ฐฉ์ค ์์ด ์ต์ ์ ํํ์ ์ฐพ์ต๋๋ค. ์๋ ๋ฐฉ์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- 1์์ , ์ฑ๊ณต ์งํ ๋ฐ ์ด๊ธฐ ์์๋ฅผ ์ ์ํ์ญ์์ค. ์์: ์์ = '๊ณ ๊ฐ ๋๊ธ์ ๊ฐ์ ๋ถ๋ฅ.' ์ฑ๊ณต ์งํ = '20๊ฐ์ ๋ ์ด๋ธ์ด ์ง์ ๋ ์์์์์ ์ ํ๋.' ์ด๊ธฐ ์์ = ์ฌ๋ฐ๋ฅธ ๊ฐ์ ๋ ์ด๋ธ์ด ์๋ ๋ค์ํ 3๊ฐ์ ๊ณ ๊ฐ ๋ฉ์์ง.
- 2APE ๋๊ตฌ ๋๋ ChatGPT๋ฅผ ์ฌ์ฉํ์ฌ ํ๋กฌํํธ ๋ณํ์ ์๋์ผ๋ก ์์ฑํ์ญ์์ค. ์์ ๊ณผ ์์๋ฅผ ์ ๊ณตํ๊ณ ๋ฌป์ต๋๋ค: '์ด ์์ ์ ํด๊ฒฐํ ์ ์๋ 5๊ฐ์ง ๋ค๋ฅธ ํ๋กฌํํธ ๋ณํ์ ์์ฑํ์ญ์์ค. ์ง์ ์คํ์ผ, ์์ ๋ฐ ์ ์ฝ ์กฐ๊ฑด์ ๋ค์ํ๊ฒ ๋ณ๊ฒฝํ์ญ์์ค.' ํ ์คํธ ์ธํธ์์ ๊ฐ ๋ณํ์ ํ๊ฐํ์ญ์์ค.
- 3์ฑ๊ณต ์งํ์์ ๊ฐ ๋ณํ์ ์ ์๋ฅผ ๋งค๊ธฐ์ญ์์ค. ๋ณด๋ฅ๋ ์์์์ ๋ชจ๋ ๋ณํ์ ์คํํ์ญ์์ค. ์ ํ๋, ์๋ ๋ฐ ๋น์ฉ์ ๊ธฐ๋กํ์ญ์์ค. APE์ ๋ชฉํ๋ ์๋ ์ํ์ฐฉ์ค ์์ด ์ต์์ ํ๋กฌํํธ๋ฅผ ์ฐพ๋ ๊ฒ์ ๋๋ค.
- 4๋ฐ๋ณตํ์ญ์์ค: ์์ 2๊ฐ์ ๋ณํ์ ์ ํํ๊ณ , ์ต์ ํ ๋๊ตฌ์๊ฒ ์ด๋ค์ ๋ณํ์ ์์ฑํ๋๋ก ์์ฒญํ์ญ์์ค. ๋ณํ 3์ด ์ ํ๋ 85%๋ฅผ ๋ฌ์ฑํ๊ณ ๋ณํ 5๊ฐ 82%๋ฅผ ๋ฌ์ฑํ๋ค๋ฉด, ์ต์ ํ ๋๊ตฌ์๊ฒ 'ํน์ ์กฐ์ ์ ๊ฐ์ง ๋ณํ 3๊ณผ ์ ์ฌํ ๋ณํ์ ์์ฑํ์ญ์์ค'๋ผ๊ณ ์์ฒญํ์ญ์์ค. ๋ฐ๋ณต์ ์ผ๋ก ๊ฐ์ ํ์ญ์์ค.
- 5๊ฐ๋ ฅํ ํ๋กฌํํธ๊ฐ ์๊ธฐ๋ฉด ์๋ก์ด ๋ฐ์ดํฐ๋ก ํ ์คํธํ์ฌ ์ผ๋ฐํ๋๋์ง ํ์ธํ์ญ์์ค. ์ต์ ํ๋ ํ๋กฌํํธ๊ฐ ํ ์คํธ ์ธํธ์์ ์ ์๋ํ์ต๋๋ค โ ์ด์ ๋ณด์ด์ง ์๋ ์๋ก์ด ์์์์ ์๋ํ๋์ง ํ์ธํ์ญ์์ค. ์ฑ๋ฅ์ด ๋จ์ด์ง๋ฉด ํ ์คํธ ๋ฐ์ดํฐ์ ๊ณผ์ ํฉ๋์์ ์ ์์ต๋๋ค.
๊ด๋ จ ์ฝ๊ธฐ
- Chain-of-Thought ํ๋กฌํํ โ APE๊ฐ ์ธ ๋จ๊ณ๋ก ๊ณต์ํํ๋ ์ถ๋ก ๊ธฐ๋ฒ
- ์ด๋ค ํ๋กฌํํธ ํ๋ ์์ํฌ๋ฅผ ์ฌ์ฉํด์ผ ํฉ๋๊น? โ APE vs CRAFT vs CO-STAR vs SPECS ๋น๊ต
- ๋จ์ผ ๋จ๊ณ ํ๋กฌํํธ ๋ฐฉ๋ฒ โ APE์ ์ธ ๋จ๊ณ๊ฐ ํ์ํ์ง ์์ ๋
- ๋ชจ๋ ํ๋กฌํํธ์ ํ์ํ 5๊ฐ์ง ๊ตฌ์ฑ ์์ โ APE ๋จ๊ณ๊ฐ ๊ตฌ์ฑํ๋ ๋ณดํธ์ ๋ธ๋ก๋ค
- ํ๋ฅด์๋ ํ๋กฌํํ โ ๋๋ฉ์ธ๋ณ ๋ถ์์ ์ํ APE ์ญํ ์ ์์ ๊ฒฐํฉํ๊ธฐ
- ํ๋กฌํํธ ์ฒด์ด๋ โ ๋จ์ผ APE ํ๋กฌํํธ์ ๋๋ฌด ๋ณต์กํ ์์ ์ ์ํด ์ฌ๋ฌ APE ๋จ๊ณ ์ฐ๊ฒฐํ๊ธฐ
์ถ์ฒ
- White et al. (2023). "A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT." arXiv:2302.11382 โ ๊ตฌ์กฐํ๋ ์ถ๋ก ํจํด์ ํฌํจํ ํ๋กฌํํธ ํจํด ๋ถ๋ฅ
- Zhou et al. (2022). "Large Language Models Are Human-Level Prompt Engineers." arXiv:2211.01910 โ ์๋ ํ๋กฌํํธ ์์ง๋์ด๋ง(APE)์ ์๋ณธ ๋ ผ๋ฌธ
- Anthropic. "Prompt Engineering Guide." docs.anthropic.com โ ๊ตฌ์กฐํ๋ ํ๋กฌํํ ๋ชจ๋ฒ ์ฌ๋ก
- OpenAI. "Prompt Engineering Guide." platform.openai.com โ ๋จ๊ณ๋ณ ์ถ๋ก ๋ฐ ๊ตฌ์กฐํ๋ ์ถ๋ ฅ ๊ฐ์ด๋