ํ์ ์ํ ํ๋กฌํํธ ์ต์ ํ๋?
ํ๋กฌํํธ ์ต์ ํ๋ ๊ตฌ์กฐํ๋ ๋ฐ๋ณต, ๋ณํ ํ ์คํธ, ์ถ๋ ฅ ์ธก์ ์ ํตํด AI ํ๋กฌํํธ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๊ฐ์ ํ๋ ํ๋ก์ธ์ค์ ๋๋ค โ ์ฆํฅ์ ์ธ ํ๋กฌํํธ ์์ฑ๊ณผ๋ ๋ค๋ฆ ๋๋ค. ์์ง๋์ด๊ฐ ํ๋กฌํํธ๋ฅผ ์กฐ์ ํ๊ณ ๊ตฌ๋๋ก ๊ณต์ ํ ๋ ๊ฐ์ ์ฌํญ์ ์ฌํํ๊ฑฐ๋ ๋น๊ตํ ์ ์์ต๋๋ค. ํ์ด ์ฒด๊ณ์ ์ธ ์ต์ ํ๋ฅผ ์ฑํํ๋ฉด ๋ชจ๋ ์์ง๋์ด๊ฐ ๋์ผํ ํ๋กฌํํธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ํธ์งํ๊ณ , ๋์ผํ ํ ์คํธ ๋ฐ์ดํฐ์ ์ ๊ธฐ์ค์ผ๋ก ๋ณํ์ ๋น๊ตํ๋ฉฐ, ์ด๋ค ๋ณ๊ฒฝ์ด ์ค์ ๋ก ํ์ง์ ํฅ์์ํค๋์ง ์ถ์ ํฉ๋๋ค.
ํ ์ต์ ํ๊ฐ ๊ฐ์ธ ์์ ๊ณผ ๋ค๋ฅธ ์ : ์ฌ๋ฌ ์์ง๋์ด๊ฐ ๋์์ ํธ์งํ๋ ๊ณต์ ํ๋กฌํํธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ, ํ๋ก๋์ ํ๋กฌํํธ์ ๋ฌด๋จ ๋ณ๊ฒฝ์ ๋ฐฉ์งํ๋ ๊ฒํ ์ํฌํ๋ก, ์ค์ ์ํฅ์ ์ธก์ ํ๋ A/B ์คํ, ์ปดํ๋ผ์ด์ธ์ค๋ฅผ ์ํ ๊ฐ์ฌ ์ถ์ . ๊ฐ์ธ์ ์ธ ํ๋กฌํํธ ์กฐ์ ์ ๋น ๋ฅด์ง๋ง ์ทจ์ฝํฉ๋๋ค; ํ ์ต์ ํ๋ ์ค์ ์ ์๊ฐ์ด ๋ ๊ฑธ๋ฆฌ์ง๋ง ํ์ฅ ๊ฐ๋ฅํฉ๋๋ค.
์ด ๊ฐ์ด๋๋ ํ๋กฌํํธ ์ต์ ํ(ํ๋กฌํํธ๋ฅผ ๋ ์ข๊ฒ ๋ง๋ค๊ธฐ)์ ํ๋กฌํํธ ๊ด๋ฆฌ(๊ตฌ์ฑ ๋ฐ ๋ฐฐํฌ), ํ๋กฌํํธ ํ๊ฐ(ํ์ง ์ธก์ )๋ฅผ ๊ตฌ๋ณํฉ๋๋ค. ๋๋ถ๋ถ์ ํ์ ์ธ ๊ฐ์ง ๋ฒ์ฃผ ๋ชจ๋์ ๋๊ตฌ๊ฐ ํ์ํฉ๋๋ค. ์ต์ ํ ์ค ๋ค์ค ๋ชจ๋ธ ๋น๊ต๋ฅผ ์ํด PromptQuorum์ ํ๋กฌํํธ๋ฅผ 25๊ฐ ์ด์์ AI ๊ณต๊ธ์ ์ฒด์ ๋์์ ์ ์กํฉ๋๋ค โ ํ๋กฌํํธ ๋ณ๊ฒฝ์ด ๋ชจ๋ธ ์ ๋ฐ์ ๊ฑธ์ณ ์ผ๋ฐํ๋๋์ง ๊ฒ์ฆํ๋ ํ์ ์ ์ฉํฉ๋๋ค.
์ต์ ํ ์ค์ฌ ๋๊ตฌ๋ง์ด ์๋ ๋ชจ๋ ํ๋กฌํํธ ์์ง๋์ด๋ง ๋๊ตฌ์ ๊ด๋ฒ์ํ ๋น๊ต๋ ์ต๊ณ ์ ํ๋กฌํํธ ์์ง๋์ด๋ง ๋๊ตฌ 2026: ์ฌ์ฉ ์ฌ๋ก๋ณ ์์๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
๋๊ตฌ ํ๊ฐ ๊ธฐ์ค
์ฌ์ฏ ๊ฐ์ง ๋๊ตฌ๋ฅผ ๋ค์ฏ ๊ฐ์ง ๊ธฐ์ค์ผ๋ก ํ๊ฐํ์ต๋๋ค: ํ ํ์ ๊ธฐ๋ฅ, A/B ํ ์คํธ ๊ธฐ๋ฅ, ํ๊ฐ/์ ์ ์ง์, CI/CD ํตํฉ, ๊ฐ๊ฒฉ ํฌ๋ช ์ฑ. ๊ฐ ๊ธฐ์ค์ ํ ํ๋กฌํํธ ์ํฌํ๋ก์์ ์ค์ ๋ณ๋ชฉ ํ์์ ๋ฐ์ํฉ๋๋ค.
| ๊ธฐ์ค | ํ์ ์ค์ํ ์ด์ | ์ต์ ์์ฉ ๊ธฐ์ค |
|---|---|---|
| ํ ํ์ | ์ฌ๋ฌ ์์ง๋์ด๊ฐ ์๋ก ๋ฎ์ด์ฐ์ง ์๊ณ ํ๋กฌํํธ๋ฅผ ํธ์งํฉ๋๋ค | ์ญํ ๊ธฐ๋ฐ ์ ๊ทผ ์ ์ด ๋๋ ๋ธ๋์นญ/๋ฒ์ ๊ด๋ฆฌ |
| ๋ณํ A/B ํ ์คํธ | ๋์ผํ ์ ๋ ฅ ์ธํธ์์ ํ๋กฌํํธ ๋ณํ์ ๋น๊ตํฉ๋๋ค | ์ ์ ํ๊ฐ๋ฅผ ํฌํจํ ๋๋ํ ์ถ๋ ฅ ๋น๊ต |
| ํ๊ฐ ์ง์ | ๋จ์ ๊ด์ฐฐ์ด ์๋ ์ถ๋ ฅ ํ์ง ์ธก์ | ์๋ ๊ฒํ ๋ง์ด ์๋ ์ฌ์ฉ์ ์ ์ ์งํ |
| CI/CD ํตํฉ | ๋ฐฐํฌ ์ ํ๋กฌํํธ ํ๊ท๋ฅผ ๊ฐ์งํฉ๋๋ค | ํ์ดํ๋ผ์ธ์์ ์คํ๋๋ CLI ๋๋ API |
| ๊ฐ๊ฒฉ ํฌ๋ช ์ฑ | 3โ10๋ช ํ์ ์์ฐ ์์ธก ๊ฐ๋ฅ์ฑ | ๊ณต๊ฐ ๊ฐ๊ฒฉ ํ์ด์ง; "์์ ํ์ ๋ฌธ์"๋ง์ ๋ถ๊ฐ |
Braintrust: ํ๊ฐ ์ค์ฌ ํ์
Braintrust๋ ํ์ด ์ฌ์ฉ์ ์ ์ ์งํ์ ๋ฐ๋ผ LLM ์ถ๋ ฅ์ ์ ์ํํ๊ณ , ํ๋ก๋์ ์ ๋ชจ๋ ํธ์ถ์ ๊ธฐ๋กํ๋ฉฐ, ์คํ ๊ฒฐ๊ณผ๋ฅผ ๊ณต์ ํ ์ ์๊ฒ ํ๋ AI ํ๊ฐ ํ๋ซํผ์ ๋๋ค โ ์ถ๋ ฅ ํ์ง์ ์ฒด๊ณ์ ์ผ๋ก ์ธก์ ํ๋ ํ์ ์ด์์ ์ ๋๋ค. Braintrust๋ ํ๋กฌํํธ ๋น๋๋ ๋ฒ์ ๊ด๋ฆฌ ์์คํ ์ด ์๋๋๋ค; ํ์ด ์ฌ์ฉ์ ์ ์ ์ ์ ํจ์๋ฅผ ์ค๊ณํ๊ณ , ๋ชจ๋ API ํธ์ถ์ ๊ธฐ๋กํ๋ฉฐ, ์คํ์ ์คํํ๋ ๊ณต์ ์ฐ๊ตฌ์ค์ ๋๋ค.
Team ํ๋์ ์ ~$500์ ๋๋ค. ๋ก๊น ํ๋ก์๋ ์ฝ๋ ๋ณ๊ฒฝ ์์ด OpenAI, Anthropic, Google API๋ฅผ ์ง์ํฉ๋๋ค. ์ ์ ํจ์๋ TypeScript ๋๋ Python์ผ๋ก ์์ฑํฉ๋๋ค. GitHub ํตํฉ์ ํตํด ์ฝ๋์ ํจ๊ป ํ๋กฌํํธ๋ฅผ ๋ฒ์ ๊ด๋ฆฌํฉ๋๋ค. ๋จ์ : ์ฌ์ฉ์ ์ ์ ์ ์๋ฅผ ์ค์ ํ๊ณ ์ ์งํ๊ธฐ ์ํ ๊ธฐ์ ์ ์ ๋ฌธ์ฑ์ด ํ์ํฉ๋๋ค.
ํ ๊ธฐ๋ฅ์๋ ๊ณต์ ์คํ ๋์๋ณด๋(๋ชจ๋ ๊ตฌ์ฑ์์ด ์ค์๊ฐ์ผ๋ก ๋์ผํ ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๋ด), ์ญํ ๊ธฐ๋ฐ ์ ๊ทผ ์ ์ด(๊ด๋ฆฌ์/๊ตฌ์ฑ์/๊ด์ฐฐ์), ํ๋กฌํํธ ๋ฒ์ ์ Git ์คํ์ผ ์ปค๋ฐ ์ด๋ ฅ, ํ๋ก๋์ ๋ก๊น (์ ๋ ฅ, ์ถ๋ ฅ, ์ ์๊ฐ ๊ธฐ๋ก๋ ๋ชจ๋ API ํธ์ถ)์ด ํฌํจ๋ฉ๋๋ค.
- ๊ณต์ ์คํ ๋์๋ณด๋: ๋ชจ๋ ํ ๊ตฌ์ฑ์์ด ์ค์๊ฐ์ผ๋ก ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ํ์ธํฉ๋๋ค
- ์ญํ ๊ธฐ๋ฐ ์ ๊ทผ ์ ์ด: ๊ด๋ฆฌ์/๊ตฌ์ฑ์/๊ด์ฐฐ์ ์ญํ
- Git ์คํ์ผ ์ปค๋ฐ ์ด๋ ฅ์ ํตํ ํ๋กฌํํธ ๋ฒ์ ๊ด๋ฆฌ
- ํ๋ก๋์ ๋ก๊น : ์ ๋ ฅ/์ถ๋ ฅ/์ ์๊ฐ ๊ธฐ๋ก๋ ๋ชจ๋ API ํธ์ถ
DSPy: ์๋ํ๋ ํ๋กฌํํธ ํ๋ก๊ทธ๋๋ฐ
DSPy(Stanford NLP Group, 2023)๋ ์๋์ผ๋ก ์์ฑ๋ ํ๋กฌํํธ๋ฅผ ์ ๋ ฅ/์ถ๋ ฅ ์์ ํ๋ จ ์ธํธ๋ฅผ ์ฌ์ฉํ์ฌ ์๋์ผ๋ก ์ง์นจ์ ์ต์ ํํ๋ ํ์ต ๊ฐ๋ฅํ ๋ชจ๋๋ก ๋์ฒดํฉ๋๋ค โ Python์ ์ต์ํ ๊ธฐ์ ํ์ ์ด์์ ์ ๋๋ค. DSPy๋ ์คํ์์ค(Apache 2.0)์ด๋ฉฐ ๋ฌด๋ฃ์ ๋๋ค. ์๋์ผ๋ก ํ๋กฌํํธ๋ฅผ ์์ฑํ๋ ๋์ DSPy์์ ์์ ์ ์ ์ํ๋ฉด ์์๋ฅผ ํตํด ์ต์ ์ ์ง์นจ์ ํ์ตํฉ๋๋ค.
Python 3.9+๊ฐ ํ์ํฉ๋๋ค. LiteLLM ๋ฐฑ์๋๋ฅผ ํตํด ๋ชจ๋ LLM๊ณผ ์๋ํฉ๋๋ค. ์ต์ ํ๋ฅผ ์ํด ์ผ๋ฐ์ ์ผ๋ก ๋ ์ด๋ธ์ด ์ง์ ๋ 20โ50๊ฐ์ ์์ ํ๋ จ ์ธํธ๋ก ์ถฉ๋ถํฉ๋๋ค. BootstrapFewShot ์ต์ ํ๊ธฐ๊ฐ ํ ์นํ์ ์ผ๋ก ๊ฐ์ฅ ์ ํฉํฉ๋๋ค(GPU ๋ถํ์, ๋ณต์กํ ์ํ ๋ถํ์). ํ์ค Git ์ํฌํ๋ก๋ฅผ ํตํ ํ ์นํ์ฑ โ SaaS ์์กด์ฑ ์์, ์๋ณ ์ฒญ๊ตฌ์ ์์. ๋จ์ : ์ธํฐํ์ด์ค ์์; ๊ธฐ์ ์ ์ค์ ํ์(ํ ๋์ ์ 1โ2์ผ).
๋ ์ด๋ธ์ด ์ง์ ๋ ๋ฐ์ดํฐ์ ์ ๋ณด์ ํ๊ณ ์์ผ๋ฉฐ ์ฌํ ๊ฐ๋ฅํ๊ณ ๋ฒ์ ๊ด๋ฆฌ๋ ํ๋กฌํํธ ์ต์ ํ๋ฅผ ์ํ๋ ์ฐ๊ตฌ ๋ฐ ML ํ์ ์ด์์ ์ ๋๋ค.
PromptPerfect: UI ๊ธฐ๋ฐ ์ต์ ํ
PromptPerfect๋ ์๊ฐ์ ์ธํฐํ์ด์ค๋ฅผ ๊ฐ์ถ SaaS ํ๋กฌํํธ ์ต์ ํ ๋๊ตฌ์ ๋๋ค โ ํ์ด ํ๋กฌํํธ๋ฅผ ๋ถ์ฌ๋ฃ๊ณ ๋ชจ๋ธ์ ์ ํํ๋ฉด ์ฝ๋ ์์ด ํ์ง ์ ์์ ํจ๊ป ์ต์ ํ๋ ๋ณํ์ ๋ฐ์ต๋๋ค. ์ฝ๋ ์์ด ํ๋กฌํํธ ๊ฐ์ ์ด ํ์ํ ๋น๊ธฐ์ ์ ์ฌ์ฉ์(์ฝํ ์ธ , ๋ง์ผํ , ์ ํ ํ)๋ฅผ ์ํด ์ค๊ณ๋์์ต๋๋ค.
Starter ํ๋ ์ $9.99; Team ํ๋ ~์ $49.99(์ต๋ 5๋ช ). GPT-5.5, Claude, Gemini, Stable Diffusion์ ์ง์ํฉ๋๋ค. UI๋ ์ต์ ํ๋ ํ๋กฌํํธ + ๋ณ๊ฒฝ ์ฌํญ์ ๋ํ ์์ฐ์ด ์ค๋ช ์ ๋ฐํํฉ๋๋ค. ๋๋ถ๋ถ์ ๊ตฌ์ฑ์์ด ์์ง๋์ด๊ฐ ์๋ ํ์ ์ด์์ ์ ๋๋ค. ๋จ์ : DSPy๋ณด๋ค ์ ์ด ๊ธฐ๋ฅ์ด ์ ์; CI/CD ํตํฉ ์์; ์ฌ์ ์ ์๋ ์ต์ ํ ์ ๋ต์ผ๋ก ์ ํ๋จ.
- ์ฝ๋ ์๋ UI: ํ๋กฌํํธ๋ฅผ ๋ถ์ฌ๋ฃ๊ณ ๋ชจ๋ธ์ ์ ํํ๋ฉด ์ต์ ํ๋ ๋ณํ์ ๋ฐ์ต๋๋ค
- ๋ณ๊ฒฝ ์ค๋ช : ๊ฐ ์ต์ ํ์ ๋ํ ์์ฐ์ด ๊ทผ๊ฑฐ
- ๋ค์ค ๋ชจ๋ธ ์ง์: GPT-5.5, Claude, Gemini, Stable Diffusion
Vellum: ํ๋ก๋์ A/B ํ ์คํธ
Vellum์ ํ๋กฌํํธ ๋ณํ ๊ฐ ํ๋ก๋์ ํธ๋ํฝ์ ๋ผ์ฐํ ํ๊ณ ์ค์ ์ถ๋ ฅ ํ์ง์ ์ธก์ ํ๋ ๋ด์ฅ A/B ํ ์คํธ๋ฅผ ๊ฐ์ถ ํ๋กฌํํธ ๋ฐฐํฌ ํ๋ซํผ์ ๋๋ค โ ํ๋ก๋์ ์์ LLM ๊ธฐ๋ฅ์ ์คํํ๋ ํ์ ์ด์์ ์ ๋๋ค. Vellum์ ๋จ์ํ ํ ์คํธ ๋๊ตฌ๊ฐ ์๋๋๋ค; ์ค์ ์ฌ์ฉ์ ํธ๋ํฝ์ ํ๋กฌํํธ ๋ณํ์ผ๋ก ๋ถํ ํ๊ณ ์ฑ๋ฅ์ ์ธก์ ํ๋ ํ๋ก๋์ ์ ์ด ํ๋ ์ธ์ ๋๋ค.
Starter ์ $200; Growth ์ $500; Enterprise ๋ง์ถคํ. A/B ํ ์คํธ๋ ํ๋กฌํํธ ๋ณํ ๊ฐ ํธ๋ํฝ์ ๋น์จ๋ก ๋ถํ ํฉ๋๋ค. ํ๊ฐ๋ ํ ์คํธ ๋ฐ์ดํฐ์ ์์ ๋ณํ์ ๋น๊ตํฉ๋๋ค. ํ ๊ธฐ๋ฅ: ๊ณต์ ์ํฌ์คํ์ด์ค, PR ์คํ์ผ ํ๋กฌํํธ ๊ฒํ , ๋ฐฐํฌ ์น์ธ ์ํฌํ๋ก. ๋จ์ : ๊ฐ์ฅ ๋น์ผ ์ต์ ; ์ค์ ํธ๋ํฝ์ ์์ง ์ฒ๋ฆฌํ์ง ์๋ ํ๋ฆฌ ํ๋ก๋์ ํ์๊ฒ๋ ๊ณผ๋ํฉ๋๋ค.
์ค์๊ฐ LLM ๊ธฐ๋ฅ์ ๋ณด์ ํ๊ณ ์์ผ๋ฉฐ ๋ณ๋์ ๋ฐฐํฌ๋ฅผ ๊ด๋ฆฌํ์ง ์๊ณ ์ค์ ์ฌ์ฉ์ ํธ๋ํฝ์์ ๋ณํ์ ๋น๊ตํ๋ ค๋ ์ ํ ํ์ ์ด์์ ์ ๋๋ค.
Promptfoo: ์คํ์์ค CI/CD ํ ์คํธ
Promptfoo๋ ์ฌ๋ฌ ๋ชจ๋ธ์ ๋ํด ์๋ํ๋ ํ๋กฌํํธ ํ ์คํธ ์ค์ํธ๋ฅผ ์คํํ๋ ์คํ์์ค CLI ๋๊ตฌ์ ๋๋ค โ ํ์ด ๋ฐฐํฌ ์ ํ๋กฌํํธ ํ๊ท๋ฅผ ๊ฐ์งํ๊ธฐ ์ํด CI/CD ํ์ดํ๋ผ์ธ์ ํตํฉํฉ๋๋ค. YAML๋ก ํ๋กฌํํธ ํ ์คํธ ์ผ์ด์ค๋ฅผ ์ ์ํ๊ณ , Git์ ์ปค๋ฐํ๋ฉด Promptfoo๊ฐ ๊ตฌ์ฑ๋ ๋ชจ๋ ๋ชจ๋ธ์ ๋ํด ๋ชจ๋ PR์์ ์คํํฉ๋๋ค.
๋ฌด๋ฃ(MIT ๋ผ์ด์ ์ค). CLI ์ฐ์ , YAML ๊ธฐ๋ฐ ๊ตฌ์ฑ. ํ๋กฌํํธ ํ ์คํธ ์ค์ํธ๋ฅผ ์คํํฉ๋๋ค: ์ ๋ ฅ, ์์ ์ถ๋ ฅ ํจํด, ์ฌ์ฉ์ ์ ์ LLM ๊ธฐ๋ฐ ์ด์ค์ (์: "์๋ต์ 3๊ฐ์ ๊ธ๋จธ๋ฆฌ ๊ธฐํธ๋ฅผ ํฌํจํด์ผ ํจ")์ ์ ๊ณตํฉ๋๋ค. 40๊ฐ ์ด์์ LLM ๊ณต๊ธ์ ์ฒด๋ฅผ ์ง์ํฉ๋๋ค. GitHub Actions ํตํฉ ๊ฐ๋ฅ. ํ ์นํ์ : Git์ ํ ์คํธ ๊ตฌ์ฑ, CI์์ ์คํ, ๊ณ์ ํ์ ์์. ๋จ์ : ์ธํฐํ์ด์ค ์์; ์์ง๋์ด ์ ์ฉ.
prompts:
- "Summarize this in 3 bullet points: {{text}}"
providers:
- openai:gpt-4-turbo
- anthropic:claude-opus-4.1
tests:
- vars:
text: "Long document text here"
assert:
- type: contains
value: "โข"
- type: llm-rubric
value: "Response has exactly 3 bullet points"Helicone: ๊ฐ์์ฑ + ์คํ
Helicone์ ๋ชจ๋ API ํธ์ถ์ ๊ธฐ๋กํ๊ณ , ํ๋กฌํํธ๋ณ ๋น์ฉ/์ง์ฐ ์๊ฐ์ ์ถ์ ํ๋ฉฐ, A/B ์คํ์ ์ง์ํ๋ LLM ๊ฐ์์ฑ ํ๋ซํผ์ ๋๋ค โ ํ์ง ๋ชจ๋ํฐ๋ง๊ณผ ํจ๊ป ์ค์๊ฐ ๋น์ฉ ๊ฐ์์ฑ์ด ํ์ํ ํ์ ์ด์์ ์ ๋๋ค. Helicone์ ํ๋กฌํํธ ๋น๋๊ฐ ์๋๋๋ค; ์ฑ๊ณผ LLM API ์ฌ์ด์ ์์นํ์ฌ ๋ชจ๋ ํธ์ถ์ ๊ธฐ๋กํ๋ ํ๋ก์์ ๋๋ค.
๋ฌด๋ฃ ํฐ์ด(์ 10๋ง ์์ฒญ); Pro ์ $20; Growth ์ $200. ์ ๋ผ์ธ ํตํฉ: OpenAI ํด๋ผ์ด์ธํธ์์ Helicone์ ๊ฐ๋ฆฌํค๋๋ก `baseURL`์ ๋ณ๊ฒฝํฉ๋๋ค. ์ฌ์ฉ์ ์ ์ ์์ฑ์ ํ๋กฌํํธ ๋ฒ์ , ์ฌ์ฉ์ ๋๋ ๊ธฐ๋ฅ๋ณ๋ก ์์ฒญ์ ๋ ์ด๋ธ์ ์ง์ ํฉ๋๋ค. ์คํ ๋ชจ๋์ ํ๋ก๋์ ํธ๋ํฝ์์ ํ๋กฌํํธ ๋ณํ์ ๋น๊ตํฉ๋๋ค. ๊ณต์ ํ ๋์๋ณด๋๋ ์ง์ถ, ์ค๋ฅ, ์ง์ฐ ์๊ฐ, ์คํ ๊ฒฐ๊ณผ๋ฅผ ํ์ํฉ๋๋ค. ์คํํธ์ ๊ณผ ๋น์ฉ ์์์ ์ธ ํ์ ์ด์์ ์ ๋๋ค.
PromptQuorum: ๋น๊ต๋ฅผ ์ํ ๋ค์ค ๋ชจ๋ธ ๋์คํจ์น
PromptQuorum์ ํ๋กฌํํธ๋ฅผ 25๊ฐ ์ด์์ AI ๋ชจ๋ธ์ ๋์์ ์ ์กํ๊ณ ๋๋ํ ์ถ๋ ฅ์ ๋ฐํํฉ๋๋ค โ ํน์ ๋ชจ๋ธ์ด๋ ๋ฒ์ ์ ์ปค๋ฐํ๊ธฐ ์ ์ GPT-5.5, Claude, Gemini, ๋ก์ปฌ LLM์์ ํ๋กฌํํธ ๋ณํ์ด ์ด๋ป๊ฒ ์๋ํ๋์ง ๋น๊ตํ๋ ๊ฐ์ฅ ๋น ๋ฅธ ๋ฐฉ๋ฒ์ ๋๋ค. ์ด์ ํ๊ฐ ๋๊ตฌ๋ค๊ณผ ๋ฌ๋ฆฌ(ํ ๋ฒ์ ํ๋์ ๋ชจ๋ธ์ ํ ์คํธํ๋), PromptQuorum์ "์ด ํ๋กฌํํธ๋ฅผ ๊ฐ์ฅ ์ ์ฒ๋ฆฌํ๋ ๋ชจ๋ธ์ ๋ฌด์์ธ๊ฐ?"๋ผ๋ ์ง๋ฌธ์ ๋จ ํ ๋ฒ์ ์คํ์ผ๋ก ๋ตํฉ๋๋ค.
์ฌ์ธต ํ๊ฐ๋ฅผ ์ํด Braintrust๋ก, ํ๋ก๋์ A/B ํ ์คํธ๋ฅผ ์ํด Vellum์ผ๋ก ๋ผ์ฐํ ํ๊ธฐ ์ ์ ์ฒซ ๋ฒ์งธ ๋จ๊ณ๋ก PromptQuorum์ ์ฌ์ฉํ์ญ์์ค. ๋ฌด๋ฃ ํฐ์ด ์ ๊ณต โ ๊ธฐ์ ์ ์ค์ ๋ถํ์. Ollama ๋ฐ LM Studio๋ฅผ ํตํ ๋ก์ปฌ LLM์ ํฌํจํ 25๊ฐ ์ด์์ ๋ชจ๋ธ ์ง์. ํ ํ๋ฆฟ ์ง์์ด ์๋ ๋ด์ฅ ํ๋กฌํํธ ํ๋ ์์ํฌ. ํฉ์ ์ ์๋ฅผ ํตํ ๋๋ํ ์๋ต ๋น๊ต.
ํน์ ๋ชจ๋ธ ๊ณต๊ธ์ ์ฒด๋ฅผ ์ํด ์ต์ ํํ ์ง ํ๊ฐํ๋ ํ์ด๋ ์ฌ๋ฌ LLM ์ต์ ์์ ๋์ผํ ํ๋กฌํํธ๋ฅผ ๋์์ ๋น๊ตํ๋ ค๋ ํ์ ์ด์์ ์ ๋๋ค.
๋๋ํ ๋น๊ต ํ
๋ค์ฏ ๊ฐ์ง ๊ธฐ์ค ๋ชจ๋์์ ๋ฐ์ด๋ ๋๊ตฌ๋ ์์ต๋๋ค. Braintrust๋ ํ๊ฐ ๊น์ด์์, Vellum์ ํ๋ก๋์ A/B ํ ์คํธ์์, Promptfoo๋ CI/CD ํตํฉ์์, DSPy๋ ์๋ํ๋ ์ต์ ํ์์ ์์ ์์ต๋๋ค.
| ๋๊ตฌ | A/B ํ ์คํธ | ํ์ | CI/CD | ๊ฐ๊ฒฉ | ์ต์ ๋์ |
|---|---|---|---|---|---|
| Braintrust | โ ์คํ | โ ์ญํ + ๋์๋ณด๋ | โ API | ~์ $500 | ํ๊ฐ ์ค์ฌ ํ |
| DSPy | โ ์๋ํ | Git ๊ธฐ๋ฐ | โ ๋ค์ดํฐ๋ธ | ๋ฌด๋ฃ | ๊ณ ๋ ๊ธฐ์ ํ |
| PromptPerfect | โ ๏ธ ๋ณํ๋ง | โ Team ํ๋ | โ ์์ | ์ $50 | ๋น๊ธฐ์ ์ฌ์ฉ์ |
| Vellum | โ ํธ๋ํฝ ๋ถํ | โ PR ๊ฒํ | โ ์นํ | ์ $200โ500 | ํ๋ก๋์ ๋ฐฐํฌ |
| Promptfoo | โ ๋ค์ค ๋ชจ๋ธ | Git ๊ธฐ๋ฐ | โ GitHub Actions | ๋ฌด๋ฃ | CI/CD ์ค์ฌ ํ |
| Helicone | โ ์คํ | โ ๊ณต์ ๋์๋ณด๋ | โ API | ๋ฌด๋ฃโ์ $200 | ๋น์ฉ ์์์ ์ธ ํ |
| PromptQuorum | โ ๋ค์ค ๋ชจ๋ธ | โ ๊ณต์ ์ํฌ์คํ์ด์ค | โ CI/CD ์์ | ๋ฌด๋ฃ + ํฌ๋ ๋ง | ๋ค์ค ๋ชจ๋ธ ๋น๊ต |
์ด๋ค ํ์ ์ด๋ค ๋๊ตฌ๊ฐ ๋ง๋?
ํ์ ๋ณ๋ชฉ ํ์์ ๋๊ตฌ๋ฅผ ๋ง์ถ์ญ์์ค: ํ๊ฐ ํ์ง โ Braintrust; ์๋ํ ์ต์ ํ โ DSPy; ํ๋ก๋์ A/B ํ ์คํธ โ Vellum; CI/CD ํ๊ท ๋ฐฉ์ง โ Promptfoo; ๋น์ฉ ๋ชจ๋ํฐ๋ง + ์คํ โ Helicone; ๋ค์ค ๋ชจ๋ธ ๋น๊ต โ PromptQuorum.
- 1์ฐ๊ตฌ/ML ํ โ DSPy
Why it matters: ๋ ์ด๋ธ์ด ์ง์ ๋ ๋ฐ์ดํฐ์ ์ ๋ํ ์๋ํ๋ ์ต์ ํ; ๋ค์ดํฐ๋ธ Git ์ํฌํ๋ก; SaaS ์์กด์ฑ ์์. - 2์ ํ + ์์ง๋์ด๋ง ํ โ Vellum
Why it matters: ํ๋ก๋์ ํธ๋ํฝ ๋ถํ , ์น์ธ ์ํฌํ๋ก, PM ๊ฒํ ๋ฅผ ์ํ ๋น๊ธฐ์ ์ UI. - 3์ฝํ ์ธ /๋ง์ผํ ํ โ PromptPerfect
Why it matters: ์ฝ๋ ์๋ UI, ๊ณต์ ๊ฐ๋ฅํ ์ต์ ํ๋ ํ๋กฌํํธ, ๋ค์ค ๋ชจ๋ธ ์ง์. - 4DevOps/ํ๋ซํผ ํ โ Promptfoo
Why it matters: YAML ๊ธฐ๋ฐ ํ ์คํธ ์ค์ํธ, GitHub Actions, CI์์ ํ๊ท ๊ฐ์ง. - 5์ง์ถ์ ๋ชจ๋ํฐ๋งํ๋ ์คํํธ์ โ Helicone
Why it matters: ๋ฌด๋ฃ ํฐ์ด๋ ์ 10๋ง ์์ฒญ ์ฒ๋ฆฌ; ์ฒซ๋ ๋ถํฐ ํ๋กฌํํธ๋ณ ๋น์ฉ ๊ฐ์์ฑ. - 6๋ชจ๋ ํ(์ฒซ ๋ฒ์งธ ๋จ๊ณ) โ PromptQuorum
Why it matters: ๋ชจ๋ธ๋ณ ์ต์ ํ ๋๊ตฌ์ ํฌ์ํ๊ธฐ ์ ์ ํน์ ํ๋กฌํํธ์์ ๋ชจ๋ธ ์ฑ๋ฅ์ ๋น๊ตํ์ญ์์ค.
โ ์ต์ ํ๋ฅผ ์ผํ์ฑ ์์ ์ผ๋ก ์ทจ๊ธํ๊ธฐ
Why it hurts: ๋ชจ๋ธ์ด ์ ๋ฐ์ดํธ๋๊ณ ๋ฐ์ดํฐ ๋๋ฆฌํํธ๊ฐ ๋ฐ์ํจ์ ๋ฐ๋ผ ํ๋กฌํํธ๊ฐ ์ ํ๋ฉ๋๋ค.
Fix: ๋์ผํ ํ ์คํธ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ ์๋ณ ์ฌํ๊ฐ๋ฅผ ์์ฝํ์ญ์์ค. Promptfoo์ YAML ๊ตฌ์ฑ์ด ์ด๋ฅผ ์ฌํ ๊ฐ๋ฅํ๊ฒ ๋ง๋ญ๋๋ค.
โ ํ๊ฐ ๋ฐ์ดํฐ์ ๊ตฌ์ถ ์ SaaS ๋๊ตฌ ๊ตฌ๋งค
Why it hurts: ๋ ์ด๋ธ์ด ์ง์ ๋ 20โ50๊ฐ์ ์ ๋ ฅ/์ถ๋ ฅ ์์ ์์ด๋ ์ ํ๋กฌํํธ๊ฐ ์ค์ ๋ก ๋ ๋์์ง ์ธก์ ํ ์ ์์ต๋๋ค.
Fix: ๋จผ์ ํ๊ฐ ๋ฐ์ดํฐ์ ์ ๊ตฌ์ถํ์ญ์์ค. ์ด๊ฒ์ด ๋ชจ๋ ์ต์ ํ ์์ ์ ๊ธฐ๋ฐ์ ๋๋ค.
โ ๋จ์ผ ๋ชจ๋ธ์ ์ฌํ์ผ๋ก ์ฌ์ฉํ๊ธฐ
Why it hurts: GPT-5.5 ์ถ๋ ฅ์ GPT-5.5๋ฅผ ์ ์ ๋ชจ๋ธ๋ก ํ๊ฐํ๋ฉด ์ ์๊ฐ 10โ20% ๋ถํ๋ ค์ง๋๋ค(model-as-judge ํธํฅ).
Fix: ์ ์ ํ๊ฐ์ ๋ค๋ฅธ ๋ชจ๋ธ์ ์ฌ์ฉํ๊ฑฐ๋ ground truth๋ฅผ ์ํด ์ธ๊ฐ ํ๊ฐ๋ฅผ ์ฌ์ฉํ์ญ์์ค.
โ ๋ณํ ๋น๊ต ์ ํ ํฐ ๋น์ฉ ๋ฌด์
Why it hurts: 5% ๋ ๋์ ์ ์๋ฅผ ๋ฐ์ง๋ง 40% ๋ ๋ง์ ํ ํฐ์ ์ฌ์ฉํ๋ ํ๋กฌํํธ๋ ์ ์ฝํ๋ ๊ฒ๋ณด๋ค ๋ ๋ง์ ๋น์ฉ์ด ๋ค ์ ์์ต๋๋ค.
Fix: Helicone ๋๋ Braintrust์ ๋น์ฉ ์ถ์ ์ ์ฌ์ฉํ์ฌ ํ์ง๊ณผ ์ถ๋ ฅ๋น ๋น์ฉ์ ๋ชจ๋ ์ถ์ ํ์ญ์์ค.
โ ํ์ง ์งํ ํฉ์ ์ ๋๊ตฌ ์ฑํ
Why it hurts: ์ข์ ์ถ๋ ฅ์ ์ ์ํ์ง ์๊ณ Vellum์ด๋ Braintrust๋ฅผ ๊ตฌ๋งคํ ํ์ ์ต์ ํ๊ฐ ์๋๋ผ ์ ์์ ๋ํ ๋ ผ์์ผ๋ก ์ฒซ ๋ฌ์ ๋ณด๋ ๋๋ค.
Fix: ๋๊ตฌ๋ฅผ ์จ๋ณด๋ฉํ๊ธฐ ์ ์ 3โ5๊ฐ์ ๊ตฌ์ฒด์ ์ธ ํ์ง ๊ธฐ์ค์ ์ ์ํ์ญ์์ค.
ํ๋กฌํํธ ์ต์ ํ ์คํ ์ ํ ๋ฐฉ๋ฒ
- 1์ฃผ์ ๋ณ๋ชฉ ํ์์ ์ ์ํ์ญ์์ค: ์ถ๋ ฅ ํ์ง, ๋น์ฉ, ์ง์ฐ ์๊ฐ, ํ ์๋ ์ค ๋ฌด์์ ๋๊น?
- 2๊ธฐ์ ๊น์ด๋ฅผ ํ๊ฐํ์ญ์์ค: ์์ง๋์ด๋ก๋ง ๊ตฌ์ฑ๋ ํ โ DSPy ๋๋ Promptfoo; ํผํฉ ํ โ Vellum ๋๋ Braintrust.
- 3๋๊ตฌ๋ฅผ ํ๊ฐํ๊ธฐ ์ ์ ๋ ์ด๋ธ์ด ์ง์ ๋ ํ๊ฐ ๋ฐ์ดํฐ์ (20โ50๊ฐ์ ์ ๋ ฅ/์ถ๋ ฅ ์)์ ๊ตฌ์ถํ์ญ์์ค.
- 4๊ธฐ์ค ์งํ๋ฅผ ์ค์ ํ๊ธฐ ์ํด ๋ฌด๋ฃ ๋๊ตฌ(Promptfoo ๋๋ Helicone)๋ก ์์ํ์ญ์์ค.
- 5SaaS ํ๋ซํผ ๋น์ฉ ์ง๋ถ ์ ์ค์ ํ ํ๋กฌํํธ๋ก 2์ฃผ๊ฐ ํ์ผ๋ฟ์ ์คํํ์ญ์์ค.
- 6๋ ๊ฐ์ง ๋๊ตฌ๋ฅผ ๊ณํํ์ญ์์ค: ํ๊ฐ์ฉ(Braintrust, Promptfoo) + ๋ฐฐํฌ/๋ฒ์ ๊ด๋ฆฌ์ฉ(Vellum, PromptHub).
FAQ
ํ์ ์ํ ํ๋กฌํํธ ์ต์ ํ๋ ๋ฌด์์ ๋๊น?
ํ์ ์ํ ํ๋กฌํํธ ์ต์ ํ๋ ๊ตฌ์กฐํ๋ A/B ํ ์คํธ, ์ถ๋ ฅ ์ ์ ํ๊ฐ, ํ์ ๊ฒํ ๋ฅผ ํตํด LLM ํ๋กฌํํธ๋ฅผ ์ฒด๊ณ์ ์ผ๋ก ๊ฐ์ ํ๋ ๋ฐฉ๋ฒ์ ๋๋ค. ๋จ์ํ ํ๋กฌํํธ ์์ฑ๊ณผ ๋ฌ๋ฆฌ ํ ์ต์ ํ๋ ๋ฒ์ ๊ด๋ฆฌ, ์ญํ ๊ธฐ๋ฐ ์ ๊ทผ, ์ฌํ ๊ฐ๋ฅํ ํ ์คํธ ์ค์ํธ๋ฅผ ๊ฐ์ถ ๊ณต์ ๋๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
์ต์ ํ์ ํ๋กฌํํธ ๊ด๋ฆฌ์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
ํ๋กฌํํธ ๊ด๋ฆฌ๋ ํ๋กฌํํธ์ ์ ์ฅ, ๋ฒ์ ๊ด๋ฆฌ, ๋ฐฐํฌ๋ฅผ ๋ค๋ฃน๋๋ค(PromptHub, Vellum). ํ๋กฌํํธ ์ต์ ํ๋ ๋ณํ ํ ์คํธ์ ์ ์ ํ๊ฐ๋ฅผ ํตํด ํ๋กฌํํธ ํ์ง์ ์ ๊ทน์ ์ผ๋ก ๊ฐ์ ํฉ๋๋ค. ๋๋ถ๋ถ์ ํ์ ๋ ๊ฐ์ง ๋ชจ๋ ํ์ํฉ๋๋ค: ํ๋กฌํํธ ๊ตฌ์ฑ์ ์ํ ๊ด๋ฆฌ์ ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ๊ฐ์ ํ๊ธฐ ์ํ ์ต์ ํ.
3๋ช ํ์๊ฒ DSPy๋ฅผ ๋ฐฐ์ฐ๋ ๊ฒ์ด ๊ฐ์น ์์ต๋๊น?
์ ์ด๋ ํ ๋ช ์ด Python์ ๋ฅ์ํ๋ค๋ฉด ๊ทธ๋ ์ต๋๋ค. DSPy๋ ๋ ์ด๋ธ์ด ์ง์ ๋ ๋ฐ์ดํฐ์ ์ ์ฌ์ฉํ์ฌ ํ๋กฌํํธ ์์ฑ์ ์ํ์ฐฉ์ค ๊ณผ์ ์ ์๋ํํ์ฌ ์ผ๋ฐ์ ์ผ๋ก ์๋ ๋ฐ๋ณต ์๊ฐ์ 50โ70% ์ค์ ๋๋ค. ๋น๊ธฐ์ ํ์ ๊ฒฝ์ฐ PromptPerfect๊ฐ ์ฝ๋ ์์ด ์ ์ฌํ ์๋ํ๋ ๊ฐ์ ์ ์ ๊ณตํฉ๋๋ค.
5๋ช ํ์ ํ๋กฌํํธ ์ต์ ํ ์คํ ๋น์ฉ์ ์ผ๋ง์ ๋๊น?
๋๊ตฌ ์ ํ์ ๋ฐ๋ผ ์ $0โ$700์ ์์ฐ์ผ๋ก ์ฑ ์ ํ์ญ์์ค. ๋ฌด๋ฃ ์คํ(DSPy + Promptfoo + Helicone ๋ฌด๋ฃ ํฐ์ด)์ ๋๋ถ๋ถ์ ์ฌ์ฉ ์ฌ๋ก๋ฅผ ์ปค๋ฒํฉ๋๋ค. Vellum ๋๋ Braintrust๋ฅผ ํฌํจํ SaaS ์คํ์ ์ $200โ700์ ๋๋ค. ๋น์ฉ์ API ํธ์ถ ๋ณผ๋ฅจ๊ณผ ํ ๊ท๋ชจ์ ๋ฐ๋ผ ํ์ฅ๋ฉ๋๋ค.
ํ๋กฌํํธ๊ฐ ์ค์ ๋ก ๋ ๋์์ก๋์ง ์ด๋ป๊ฒ ์ธก์ ํฉ๋๊น?
์์ ์ ๋ํ 3โ5๊ฐ์ ๊ตฌ์ฒด์ ์ธ ํ์ง ๊ธฐ์ค์ ์ ์ํ์ญ์์ค(์ ํ๋, ํ์ ์ค์, ์ด์กฐ, ๊ธธ์ด). 20โ50๊ฐ์ ์ ๋ ฅ/์ถ๋ ฅ ์์ ํ ์คํธ ๋ฐ์ดํฐ์ ์ ๊ตฌ์ถํ์ญ์์ค. LLM-as-judge(ํ๊ฐ ๋์๊ณผ ๋ค๋ฅธ ๋ชจ๋ธ)๋ ์ธ๊ฐ ๊ฒํ ๋ฅผ ์ฌ์ฉํ์ฌ ์ถ๋ ฅ์ ์ ์ํํ์ญ์์ค. Braintrust์ Promptfoo ๋ชจ๋ ์ฌ์ฉ์ ์ ์ ์ ์ ํจ์๋ฅผ ์ง์ํฉ๋๋ค.
Promptfoo๊ฐ Braintrust๋ฅผ ๋์ฒดํ ์ ์์ต๋๊น?
Promptfoo(์คํ์์ค, CLI)๋ ์๋ํ๋ ํ ์คํธ ์ค์ํธ ์คํ๊ณผ CI/CD ํตํฉ์ ์ ์ฒ๋ฆฌํฉ๋๋ค. Braintrust๋ ๊ณต์ ์ธํฐํ์ด์ค, ํ๋ก๋์ ๋ก๊น , ํ ๋์๋ณด๋๋ฅผ ์ถ๊ฐํฉ๋๋ค. ๋๋ถ๋ถ์ ์์ง๋์ด๋ง ํ์ Promptfoo(๋ฌด๋ฃ)๋ก ์์ํ์ฌ ์ ์ฒด ํ์ด ํ๊ฐ ๊ฒฐ๊ณผ ๊ฐ์์ฑ์ด ํ์ํ ๋ Braintrust๋ก ์ ํํฉ๋๋ค.
Helicone์ ๋ชจ๋ LLM ๊ณต๊ธ์ ์ฒด์ ์๋ํฉ๋๊น?
Helicone์ OpenAI, Anthropic(Claude), Groq, Mistral, Gemini, Azure OpenAI ๋ฐ OpenAI ํธํ ์๋ํฌ์ธํธ๋ฅผ ์ง์ํฉ๋๋ค. ํตํฉ์๋ API ํด๋ผ์ด์ธํธ์ URL ๋ณ๊ฒฝ๋ง ํ์ํฉ๋๋ค โ SDK ์์กด์ฑ ์์.
ํ์ด Promptfoo ๋์ Vellum์ ์ฌ์ฉํด์ผ ํ๋ ๊ฒฝ์ฐ๋ ์ธ์ ์ ๋๊น?
ํ๋ก๋์ ํธ๋ํฝ ๋ถํ (์ค์ ์ฌ์ฉ์๋ฅผ ํตํ A/B ํ ์คํธ), ๋น๊ธฐ์ ํ ๊ตฌ์ฑ์์ด UI๋ฅผ ํตํด ํ๋กฌํํธ๋ฅผ ๊ด๋ฆฌํ๋ ๊ฒฝ์ฐ, ๋๋ ํ๋กฌํํธ ๋ฐฐํฌ ์ PR ์คํ์ผ ์น์ธ ์ํฌํ๋ก๊ฐ ํ์ํ ๋ Vellum์ ์ฌ์ฉํ์ญ์์ค. YAML๊ณผ CLI ๋๊ตฌ์ ์ต์ํ ํ์์ CI/CD ํตํฉ์ด ํ์ํ ๋๋ Promptfoo๋ฅผ ์ฌ์ฉํ์ญ์์ค.
- ํ๋กฌํํธ ์ต์ ํ ๊ธฐ์ด: ์ค์ฉ ๊ฐ์ด๋
- ํ๋กฌํํธ ํ์ง ํ๊ฐ ๋ฐฉ๋ฒ: ์งํ์ ๋ฐฉ๋ฒ๋ก
- ์๋ vs ์๋ ํ๋กฌํํธ ์ต์ ํ: ๊ฐ๊ฐ ์ธ์ ์ฌ์ฉํ ๊น
- ์ต๊ณ ์ ํ๋กฌํํธ ์์ง๋์ด๋ง ๋๊ตฌ 2026: ์ฌ์ฉ ์ฌ๋ก๋ณ ์์
- ์ต๊ณ ์ ํ๋กฌํํธ ๊ด๋ฆฌ ํ๋ซํผ 2026
- ๋ชจ๋ธ ๊ฐ ํ๋กฌํํธ ํ ์คํธ ๋ฐฉ๋ฒ
์ถ์ฒ
๋ง์ง๋ง ์ฌ์ค ํ์ธ: 2026-04-29 โ ๋ชจ๋ ๊ฐ๊ฒฉ, ๊ธฐ๋ฅ ๋ฐ ํตํฉ์ด ๊ณต์ ๋ฌธ์๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ฒ์ฆ๋์์ต๋๋ค.
- Khattab et al., 2023. "DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines." arXiv:2310.03714 โ DSPy ๊ธฐ์ด ๋ ผ๋ฌธ; ์๋ํ๋ ํ๋กฌํํธ ์ต์ ํ ๊ธฐ๋ฅ ์ฃผ์ฅ์ ๊ทผ๊ฑฐ.
- Zheng et al., 2023. "Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena." NeurIPS 2023 โ model-as-judge ํธํฅ ๋ฐ๊ฒฌ; ํํ ์ค์์์ 10โ20% ๋ถํ๋ฆผ ์ฃผ์ฅ์ ๊ทผ๊ฑฐ.
- Braintrust ๊ฐ๊ฒฉ ํ์ด์ง โ braintrustdata.com/pricing โ Braintrust Team ํฐ์ด ์ $500 ์ฃผ์ฅ์ ๊ทผ๊ฑฐ.
- Promptfoo GitHub ์ ์ฅ์ โ github.com/promptfoo/promptfoo โ ์คํ์์ค ํ๋กฌํํธ ํ ์คํธ CI/CD ํ๋ ์์ํฌ; Promptfoo ๊ธฐ๋ฅ ์ฃผ์ฅ์ ๊ทผ๊ฑฐ.
- Vellum ํ๋ซํผ โ vellum.ai โ ํ๋ก๋์ ๋ฐฐํฌ ํ๋ซํผ; A/B ํ ์คํธ ๋ฐ ์น์ธ ์ํฌํ๋ก ์ฃผ์ฅ์ ๊ทผ๊ฑฐ.
- Helicone ๋ฌธ์ โ docs.helicone.ai โ ๊ฐ์์ฑ ํ๋ซํผ; ํ๋ก์ ํตํฉ ๋ฐ ์คํ ๊ธฐ๋ฅ ์ฃผ์ฅ์ ๊ทผ๊ฑฐ.