โก ๋น ๋ฅธ ์ฌ์ค
- PromptQuorum โ 25๊ฐ ์ด์์ ๋ชจ๋ธ์ ๋์์ ํ๋กฌํํธ๋ฅผ ๋์คํจ์นํฉ๋๋ค. ์คํ์ ํฌ์ํ๊ธฐ ์ ์ ๋ชจ๋ธ ์ ํ์ ์ด์์ ์ ๋๋ค (๋ฌด๋ฃ)
- Braintrust โ ํ๊ฐ + ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ. LLM ํ์ฌ, ์ธ๊ฐ ํผ๋๋ฐฑ, ํ๋ก๋์ ํธ๋ ์ด์ฑ. ๋ฌด๋ฃ / ์ $249 Pro
- Confident AI โ 50๊ฐ ์ด์์ ๋ด์ฅ ํ๊ฐ ๋ฉํธ๋ฆญ๊ณผ red teaming. ๋ ๋ฎ์ ํธ๋ ์ด์ฑ ๋น์ฉ์ผ๋ก Braintrust์ ๋์. Starter ์ฌ์ฉ์๋น ์ $19.99
- Vellum โ ์ํฌํ๋ก ๋น๋, A/B ํ ์คํ , RAG, ๋ชจ๋ํฐ๋ง์ด ์๋ ํ๋ก๋์ ๋ฐฐํฌ. ๋ฌด๋ฃ / ์ $500 Pro
- Promptfoo โ ์คํ์์ค CI/CD ํ ์คํ . YAML ๊ตฌ์ฑ, GitHub Actions ํตํฉ. ์์ ๋ฌด๋ฃ
- PromptHub โ Git ๋ฐฉ์ ํ๋กฌํํธ ๋ฒ์ ๊ด๋ฆฌ. ๋ธ๋์น, ๊ฒํ ์ํฌํ๋ก, ํ ํ์ . ๋ฌด๋ฃ / ์ฌ์ฉ์๋น ์ $20
- LangSmith โ LangChain ์ฑ์ ์ํ ๊ธฐ๋ณธ ํธ๋ ์ด์ฑ. ์ฒด์ธ์ ๋ชจ๋ ๋จ๊ณ, ๋ชจ๋ธ ํธ์ถ, ๋น์ฉ์ ๊ธฐ๋กํฉ๋๋ค. Developer ๋ฌด๋ฃ / Plus ์ํธ๋น ์ $39
๊ฐ ๋๊ตฌ๋ ์ด๋ค ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๊น?
๋ค์ฏ ๊ฐ์ง ๋ณ๋ชฉ์ด ํ๋กฌํํธ ์์ง๋์ด๋ง ํ์ ๋ง์ต๋๋ค: ํ๊ฐ(์ด๊ฒ์ด ์๋ํฉ๋๊น?), ํ ์คํ (์ด๊ฒ์ด ๊ณ ์ฅ๋ ๊ฒ์ ๋๊น?), ๋ฒ์ ๊ด๋ฆฌ(์ด๋ค ๋ฒ์ ์ด ๋ฐฐํฌ๋์์ต๋๊น?), ๋ฐฐํฌ(์ด๋ป๊ฒ ์๋นํฉ๋๊น?), ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ(์ ์คํจํ์ต๋๊น?). ๊ฐ ๋๊ตฌ๋ ํ๋ ๋๋ ๋ ๊ฐ์ง์ ํนํ๋์ด ์์ต๋๋ค.
์ด ์คํ์์ PromptQuorum์ ์ด๋์ ์ ํฉํฉ๋๊น?
PromptQuorum์ ์์ ์ธ๊ธํ 5๊ฐ์ง ๋๊ตฌ ์ค ์ด๋ ๊ฒ๋ ๋ค๋ฃจ์ง ์๋ ๋ณ๋ชฉ์ ํด๊ฒฐํฉ๋๋ค: ์ฌ๋ฌ AI ๋ชจ๋ธ์ ๋์์ ํ๋กฌํํธ๋ฅผ ๋์คํจ์นํ๊ณ ์ถ๋ ฅ์ ๋๋ํ ๋น๊ตํฉ๋๋ค.** Braintrust๋ ๋ชจ๋ธ ์ถ๋ ฅ์ ground truth์ ๋น๊ตํ์ฌ ํ๊ฐํฉ๋๋ค. Vellum์ ํ๋ก๋์ ์ ๋ชจ๋ธ์ ๋ฐฐํฌํฉ๋๋ค. Promptfoo๋ CI/CD์์ ๋ชจ๋ธ์ ํ ์คํธํฉ๋๋ค. PromptQuorum์ ์ฌ์ฉํ๋ฉด GPT-5.5, Claude 4.8 Opus, Gemini 3.1 Pro, Ollama๋ฅผ ํตํ ๋ก์ปฌ ๋ชจ๋ธ์ด ๋์ผํ ํ๋กฌํํธ์ ์ด๋ป๊ฒ ์๋ตํ๋์ง ํ์ธํ ์ ์์ต๋๋ค โ ๋ชจ๋ธ์ด๋ ํ๋กฌํํธ ๋ฒ์ ์ ํฌ์ํ๊ธฐ ์ ์.
์ด๊ฒ์ด PromptQuorum์ ์ํฌํ๋ก์ ์์ฐ์ค๋ฌ์ด ์ฒซ ๋ฒ์งธ ๋จ๊ณ๋ก ๋ง๋ญ๋๋ค: ๋ชจ๋ธ ๋น๊ต โ ์ต์ ์ ํ โ ๊ทธ๋ฐ ๋ค์ ํ๊ฐ(Braintrust), ํ ์คํธ(Promptfoo), ๋ฒ์ ๊ด๋ฆฌ(PromptHub), ๋ฐฐํฌ(Vellum).
- Ollama๋ฅผ ํตํ ๋ก์ปฌ LLM์ ํฌํจํ์ฌ 25๊ฐ ์ด์์ ๋ชจ๋ธ์ ๋์คํจ์น
- 9๊ฐ์ง ๋ด์ฅ ํ๋กฌํํธ ํ๋ ์์ํฌ (TRACE, CO-STAR, CRAFT, RISEN, RTF ๋ฑ)
- ํฉ์ ์ ์ ๋งค๊ธฐ๊ธฐ๋ฅผ ์ฌ์ฉํ ๋๋ํ ์๋ต ๋น๊ต
- ๋ฌด๋ฃ ํฐ์ด ์ด์ฉ ๊ฐ๋ฅ
Braintrust๋ ๋ฌด์์ ๋๊น? ํ๊ฐ, ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ, ground truth
Braintrust๋ 2026๋ 2์ Series B $8์ฒ๋ง ๋ฌ๋ฌ(๊ธฐ์ ๊ฐ์น $8์ต ๋ฌ๋ฌ) ์ดํ ์์ ํ ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ + ํ๊ฐ ํ๋ซํผ์ผ๋ก ์ฑ์ฅํ์ต๋๋ค. ํ์ฌ ์ปค๋ฒ๋ฆฌ์ง: ํ๋ก๋์ ํธ๋ ์ด์ฑ(span, ์ง์ฐ ์๊ฐ, ๋น์ฉ), LLM ํ์ฌ ๋ฐ ์ธ๊ฐ ํผ๋๋ฐฑ ๋ฃจํ, CI/CD ํ์ง ๊ฒ์ดํธ, MCP ์๋ฒ ํตํฉ, ๋๋ํ ๋ชจ๋ธ ๋น๊ต๋ฅผ ์ํ Playground. ํต์ฌ ํ๊ฐ ๋ฃจํ โ ํ๊ฐ ์ ์, ์๋ ์คํ, ์ธ๊ฐ ์ ์ ๋งค๊ธฐ๊ธฐ, ground truth ๋ฐ์ดํฐ์ ๊ตฌ์ถ โ ๋ ์ฌ์ ํ ๊ฐ์ฅ ๊ฐ๋ ฅํ ์ฐจ๋ณ์ ์ ๋๋ค.
- human-in-the-loop ํผ๋๋ฐฑ ๋ฐ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ground truth ๋ฐ์ดํฐ์ ์ด ์๋ ๊ตฌ์กฐํ๋ ํ๊ฐ์ ์ด์์
- ํ๋ก๋์ ํธ๋ ์ด์ฑ: ๊ฐ span, ์ง์ฐ ์๊ฐ, ๋น์ฉ์ ํ๊ฐ ๊ฒฐ๊ณผ์ ํจ๊ป ๊ธฐ๋ก
- Playground๋ฅผ ํตํ ๋๋ํ ๋ชจ๋ธ ๋น๊ต. MCP ์๋ฒ ํตํฉ
- ๊ฐ๊ฒฉ: ๋ฌด๋ฃ(100๋ง ์ถ์ , 1๋ง ์ ์, ๋ฌด์ ํ ์ฌ์ฉ์). Pro ์ $249. Enterprise ๋ง์ถคํ
Vellum์ด๋ ๋ฌด์์ ๋๊น? ํ๋ก๋์ ๋ฐฐํฌ, ์ํฌํ๋ก ๋น๋, ๋ชจ๋ํฐ๋ง
Vellum์ ํ๋ก๋์ ๋ฐฐํฌ๋ฅผ ๋์ด ์์ ํ LLM ๊ฐ๋ฐ ํ๋ซํผ์ผ๋ก ํ์ฅ๋์์ต๋๋ค. ํต์ฌ: A/B ํ ์คํ , ์นด๋๋ฆฌ ๋กค์์, ํด๋ฐฑ ์ฒด์ธ(GPT-5.5 โ Claude 4.8 Opus โ Gemini), ์ง์ฐ ์๊ฐ ๋ฐ ๋น์ฉ ๋ชจ๋ํฐ๋ง ๋์๋ณด๋. ์ถ๊ฐ ๊ธฐ๋ฅ: ๋๋๊ทธ ์ค ๋๋กญ ์๊ฐ์ ์ํฌํ๋ก ๋น๋, ์ฝ๋ ์ ์ ํ์ดํ๋ผ์ธ์ ์ํ Python SDK, ๋ฌธ์ ๊ฒ์ ๋ฐ RAG ํตํฉ, ๋ชจ๋ธ ๋ฒค์น๋งํน์ ์ํ LLM Leaderboard, ์ํฐํ๋ผ์ด์ฆ ์กฐ๋ฌ์ ์ํ AWS Marketplace ๋ฑ๋ก.
- ํ๋ก๋์ ๋ฐฐํฌ์ ์ด์์ โ A/B ํ ์คํ , ์นด๋๋ฆฌ ๋กค์์, ๋ชจ๋ํฐ๋ง
- ์๊ฐ์ ์ํฌํ๋ก ๋น๋: ํ์ดํ๋ผ์ธ ์ฝ๋ ์์ด ๋๋๊ทธ ์ค ๋๋กญ ์์ด์ ํธ ๊ตฌ์ถ
- RAG ํตํฉ: ๊ทผ๊ฑฐ ์๋ ํ๋กฌํํธ ํ์ดํ๋ผ์ธ์ ์ํ ๋ด์ฅ ๋ฌธ์ ๊ฒ์
- ๊ฐ๊ฒฉ: ๋ฌด๋ฃ ํฐ์ด. Pro ์ $500. Enterprise ๋ง์ถคํ(์์ ํ ๋ฌธ์)
Promptfoo๋ ๋ฌด์์ ๋๊น? ๋น์ฉ ์๋ ์คํ์์ค CI/CD ํ ์คํ
Promptfoo๋ ์ต๊ณ ์ ๋ฌด๋ฃ ์ต์ ์ ๋๋ค. CLI ๋๊ตฌ๋ก, YAML ๊ตฌ์ฑ์์ ํ ์คํธ๋ฅผ ์คํํ๊ณ CI/CD์ ํตํฉ๋๋ฉฐ red teaming(ํ์ฅ ํ์ง, ๋ ์ฑ ์ ์)์ ํฌํจํฉ๋๋ค. ๋น์ฉ ์์ด ํ ์คํ ํ๋ ค๋ฉด ์ฌ๊ธฐ์ ์์ํ์ญ์์ค.
- GPT-5.5, Claude 4.8 Opus, Gemini 3.1 Pro ๋ฐ Ollama์ LM Studio๋ฅผ ํตํ ๋ก์ปฌ ๋ชจ๋ธ์ ๊ธฐ๋ณธ์ผ๋ก ์ง์
- ๋ฌด๋ฃ ์์ฒด ํธ์คํ CI/CD ํ ์คํ ์ ์ด์์
- ๋ด์ฅ red teaming: ํ์ฅ ๋ฐ ๋ ์ฑ ํ์ง
PromptHub๋ ๋ฌด์์ ๋๊น? AI ํ๋กฌํํธ๋ฅผ ์ํ Git ๋ฐฉ์ ๋ฒ์ ๊ด๋ฆฌ
PromptHub๋ ํ๋กฌํํธ๋ฅผ ์ฝ๋์ฒ๋ผ ์ทจ๊ธํฉ๋๋ค: ๋ฒ์ ๊ด๋ฆฌ, ๋ธ๋์น, ํ ํ์ . ๋ณ๊ฒฝ ์ฌํญ์ ๋ ผ์ํ๊ณ ๋๊ฐ ๋ฌด์์ ๋ณ๊ฒฝํ๋์ง ์ถ์ ํ๊ณ ์ด์ ๋ฒ์ ์ผ๋ก ๋๋๋ฆฝ๋๋ค. ๊ฑฐ๋ฒ๋์ค ์๊ตฌ ์ฌํญ์ด ์๋ ํ์ ํ์์ ์ ๋๋ค.
- ์ฝ๋ ๊ฒํ ๋ฐฉ์ ์น์ธ ์ํฌํ๋ก๊ฐ ํ์ํ ํ์ ์ด์์
- ๊ณต๊ฐ/๋น๊ณต๊ฐ URL๋ก ํ ๊ฐ ํ๋กฌํํธ ๊ณต์ ๊ฐ๋ฅ
- ๊ฐ๊ฒฉ: ๋ฌด๋ฃ(๊ณต๊ฐ ํ๋กฌํํธ, ๋ฌด์ ํ ๋ฉค๋ฒ). Pro ์ $12(๊ฐ์ธ, ๋น๊ณต๊ฐ ํ๋กฌํํธ). Team ์ฌ์ฉ์๋น ์ $20
LangSmith๋ ๋ฌด์์ ๋๊น? LangChain์ ์ํ ํธ๋ ์ด์ฑ ๋ฐ ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ
LangSmith๋ LangChain ์ ํ๋ฆฌ์ผ์ด์ ์ ์ํ ๊ธฐ๋ณธ ํธ๋ ์ด์ฑ์ ์ ๊ณตํฉ๋๋ค. ํ๋ก๋์ ์์ ๋ชจ๋ ํ๋กฌํํธ, ๋ชจ๋ธ ํธ์ถ, ํ ํฐ ์๋ฅผ ๊ธฐ๋กํฉ๋๋ค. ์์ฒญ์ ์ฌ์ํ๊ณ ์คํจ๋ฅผ ๋๋ฒ๊น ํ๊ณ ์ฌํ๋ จ์ ์ํ ๋ฐ์ดํฐ๋ฅผ ์์งํฉ๋๋ค. LangChain์ ์ฌ์ฉํ๋ค๋ฉด ํ์์ ๋๋ค.
- ํ๋ก๋์ ์์ LangChain ์ ํ๋ฆฌ์ผ์ด์ ์ ํ์
- ๋ค๋จ๊ณ ํ๋กฌํํธ ์ฒด์ธ์ ์ธ๋ถ ํธ๋ ์ด์ฑ
- ๊ฐ๊ฒฉ: Developer ์ํธ๋น $0(์ 5์ฒ ์ถ์ , ์ฌ์ฉ๋ ๊ธฐ๋ฐ ์๊ธ). Plus ์ํธ๋น ์ $39. Enterprise ๋ง์ถคํ
Confident AI๋ ๋ฌด์์ ๋๊น? LLM ์๋ํ ํ๊ฐ ๋ฐ red teaming
Confident AI(์คํ์์ค DeepEval ํ๋ ์์ํฌ ๊ธฐ๋ฐ)๋ ์๋ํ ํ๊ฐ๋ฅผ ์ํ Braintrust์ ์ฃผ์ ๋์์ ๋๋ค. Braintrust๊ฐ human-in-the-loop ํผ๋๋ฐฑ๊ณผ ๋ฐ์ดํฐ์ ์ถ์ ์ ์ด์ ์ ๋ง์ถ๋ ๋ฐ๋ฉด, Confident AI๋ ์ฌ์ ๊ตฌ์ถ๋ ๋ฉํธ๋ฆญ์ ๊ฐ์กฐํฉ๋๋ค: ์ฌ์ฉ์ ์ ์ ์ค์ฝ์ด๋ฌ ์ค์ ์์ด 50๊ฐ ์ด์์ ๋ด์ฅ ์ค์ฝ์ด๋ฌ(์ฌ์ค์ฑ, ์๋ต ๊ด๋ จ์ฑ, ํ๊ฐ, ๋ ์ฑ, G-Eval ๋ฑ). Panasonic, Amazon, BCG๊ฐ ์ฌ์ฉํฉ๋๋ค. ํธ๋ ์ด์ฑ ๊ฐ๊ฒฉ์ Pro์์ Braintrust์ GB๋น $3 ๋๋น GB-์๋น $1์ ๋๋ค.
- 50๊ฐ ์ด์์ ๋ด์ฅ ํ๊ฐ ๋ฉํธ๋ฆญ โ ์ฌ์ฉ์ ์ ์ ์ค์ฝ์ด๋ฌ ์ค์ ๋ถํ์
- ๋ฉํฐํด ๋ํ ์๋ฎฌ๋ ์ด์ ๋ฐ ์๋ํฌ์๋ HTTP ํ์ดํ๋ผ์ธ ํ ์คํ
- ๋ด์ฅ red teaming: LLM์ฉ OWASP Top 10, NIST AI RMF ์ ๋ ฌ, ํ์ฅ ํ์ง
- ๊ฐ๊ฒฉ: ๋ฌด๋ฃ(์ฃผ 5ํ ํ ์คํธ ์คํ, 2์ํธ). Starter ์ฌ์ฉ์๋น ์ $19.99. Premium ์ฌ์ฉ์๋น ์ $49. Enterprise ๋ง์ถคํ
6๊ฐ์ง ๋๊ตฌ๋ ์ด๋ป๊ฒ ๋น๊ต๋ฉ๋๊น? ๋๋ํ ๊ธฐ๋ฅ ๋ถ์
2026๋ 4์ ๊ธฐ์ค, 6๊ฐ์ง ๋๊ตฌ์ ์ ์ฒด ๊ธฐ๋ฅ ๋ถ์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
| ๋๊ตฌ | ๋ฉํฐ๋ชจ๋ธ | ํ๊ฐ | ํ ์คํ | ๋ฒ์ ๊ด๋ฆฌ | ํ๋ก๋์ | ๊ฐ๊ฒฉ |
|---|---|---|---|---|---|---|
| PromptQuorum | ์ฐ์ | ์๋์ค | ์๋์ค | ์๋์ค | ์๋์ค | ๋ฌด๋ฃ + ํฌ๋ ๋ง |
| Braintrust | ๊ธฐ๋ณธ | ์ฐ์ | ๊ธฐ๋ณธ | ์๋์ค | ๊ธฐ๋ณธ | ๋ฌด๋ฃ / ์ $249 |
| Confident AI | ์๋์ค | ์ฐ์ | ์ฐ์ | ๊ธฐ๋ณธ | ์๋์ค | ์ฌ์ฉ์๋น ์ $19.99 |
| Vellum | ๊ธฐ๋ณธ | ์๋์ค | ๊ธฐ๋ณธ | ์ | ์ฐ์ | ๋ฌด๋ฃ / ์ $500 |
| Promptfoo | ์๋์ค | ์๋์ค | ์ฐ์ | Git ์ฌ์ฉ | CI/CD๋ง | ๋ฌด๋ฃ |
| PromptHub | ์๋์ค | ์๋์ค | ์๋์ค | ์ฐ์ | ์๋์ค | ๋ฌด๋ฃ / ์ฌ์ฉ์๋น ์ $20 |
| LangSmith | ์๋์ค | ์๋์ค | ์๋์ค | ์๋์ค | ํธ๋ ์ด์ฑ๋ง | ๋ฌด๋ฃ / ์ํธ๋น ์ $39 |
์ฌ๋ฐ๋ฅธ ํ๋กฌํํธ ์์ง๋์ด๋ง ๋๊ตฌ๋ฅผ ์ด๋ป๊ฒ ์ ํํฉ๋๊น?
์ํฌํ๋ก ๋จ๊ณ์ ๋ฐ๋ผ ๋๊ตฌ๋ฅผ ์ ํํ์ญ์์ค. ๋ชจ๋ ํ: ๋ชจ๋ธ ๋น๊ต๋ฅผ ์ํด PromptQuorum์ผ๋ก ์์ํ ๋ค์ ๋ณ๋ชฉ์ ๋ง๋ ์ ๋ฌธ ๋๊ตฌ๋ฅผ ์ถ๊ฐํ์ญ์์ค.
- ๋ชจ๋ ํ โ ๋ชจ๋ธ ์ ํ: ์คํ์ ํฌ์ํ๊ธฐ ์ ์ GPT-5.5, Claude 4.8 Opus, Gemini, ๋ก์ปฌ ๋ชจ๋ธ์ ๋๋ํ ๋น๊ตํ๊ธฐ ์ํด PromptQuorum(๋ฌด๋ฃ)์ผ๋ก ์์ํ์ญ์์ค.
- ์คํํธ์ (<10๋ช ): PromptQuorum + Promptfoo(๋ฌด๋ฃ) + PromptHub(๋ฒ์ ๊ด๋ฆฌ). ํ๊ฐ ํ์ง์ด ์ค์ํด์ง ๋ Braintrust๋ก ๋ฐ์ ํ์ญ์์ค.
- ํ๋ก๋์ ๋ฐฐํฌ: Vellum(๋ฐฐํฌ/๋ชจ๋ํฐ๋ง) + Promptfoo(CI/CD ํ ์คํ ) + Braintrust ๋๋ Confident AI(์คํ๋ผ์ธ ํ๊ฐ)
- LangChain ์ง์ค ์ฌ์ฉ: LangSmith(์ฒด์ธ ํธ๋ ์ด์ฑ์ ํ์) + Promptfoo(๋จ์ ํ ์คํธ) + Confident AI ๋๋ Braintrust(์คํ๋ผ์ธ ํ๊ฐ)
- ์ํฐํ๋ผ์ด์ฆ(๊ฑฐ๋ฒ๋์ค ์ค์): PromptHub(๊ฐ์ฌ ์ถ์ ) + Braintrust ๋๋ Confident AI(ํ๊ฐ ๊ฑฐ๋ฒ๋์ค) + Vellum(ํ๋ก๋์ ๋ชจ๋ํฐ๋ง)
ํ๋กฌํํธ ์์ง๋์ด๋ง ๋๊ตฌ ์คํ์ ์ด๋ป๊ฒ ๊ตฌ์ฑํฉ๋๊น?
- 1๋ณ๋ชฉ ํ์ : ๋ชจ๋ธ ์ ํ, ํ๊ฐ ํ์ง, ํ ์คํธ ์ปค๋ฒ๋ฆฌ์ง, ๋ฒ์ ๊ด๋ฆฌ ๋๋ ํ๋ก๋์ ์์ ์ฑ ์ค ๋ฌธ์ ๊ฐ ๋ฌด์์ ๋๊น? ๊ฐ์ฅ ํฐ ๊ฒฉ์ฐจ๋ฅผ ํด๊ฒฐํ๋ ๋๊ตฌ๋ถํฐ ์์ํ์ญ์์ค.
- 2๋ฌด๋ฃ๋ก ์์: PromptQuorum(๋ฉํฐ๋ชจ๋ธ ๋น๊ต)์ ๋ฑ๋กํ๊ณ Promptfoo(CI/CD ํ ์คํ )๋ฅผ ์ค์นํ์ญ์์ค. ๋ ๋ค ๋ฌด๋ฃ์ด๋ฉฐ ๊ฐ์ฅ ์ผ๋ฐ์ ์ธ ๋ ์์์ ์ ๋ค๋ฃน๋๋ค.
- 3์ด๊ธฐ์ ๋ฒ์ ๊ด๋ฆฌ ์ถ๊ฐ: ํ์์ ํ๋กฌํํธ๋ฅผ ํธ์งํ๋ ์ธ์์ด 2๋ช ์ ์ด๊ณผํ๊ธฐ ์ ์ PromptHub ๋๋ Git ๊ธฐ๋ฐ ๋ฒ์ ๊ด๋ฆฌ๋ฅผ ์ค์ ํ์ญ์์ค.
- 4ํ์ง์ด ์ค์ํ ๋ ํ๊ฐ ์ถ๊ฐ: ์ ์ ๋งค๊ธฐ๊ธฐ์ human-in-the-loop ํผ๋๋ฐฑ์ด ์๋ ground truth ๋ฐ์ดํฐ์ ์ด ํ์ํ ๋ Braintrust๋ฅผ ํตํฉํ์ญ์์ค.
- 5๋ง์ง๋ง์ผ๋ก ํ๋ก๋์ ๋๊ตฌ ์ถ๊ฐ: ์ต์ข ์ฌ์ฉ์์๊ฒ ํ๋กฌํํธ๋ฅผ ๊ฒ์ํ๊ณ A/B ํ ์คํ , ํด๋ฐฑ ์ฒด์ธ, ๋ชจ๋ํฐ๋ง์ด ํ์ํ ๋ Vellum์ ๋ฐฐํฌํ์ญ์์ค.
- 6์ค๋ณต ๊ฐ์ฌ: ๋งค ๋ถ๊ธฐ๋ง๋ค ์คํ์ ๊ฒํ ํ์ญ์์ค. ๋ ๋๊ตฌ๊ฐ ๋์ผํ ๊ธฐ๋ฅ์ ๋ค๋ฃจ๊ณ ์๋ค๋ฉด ROI๊ฐ ๋ฎ์ ๊ฒ์ ์ ๊ฑฐํ์ญ์์ค.
PE ๋๊ตฌ ์ ํ ์ ๊ฐ์ฅ ํํ ์ค์๋ ๋ฌด์์ ๋๊น?
โ ๋ชจ๋ ์ ์ฉํด ๋ณด์ธ๋ค๋ ์ด์ ๋ก 5๊ฐ์ง ๋๊ตฌ ๋ชจ๋ ๊ตฌ๋งค
Why it hurts: Braintrust์ Promptfoo๋ ํ ์คํ ์์ ๊ฒน์นฉ๋๋ค โ ๋ ๋ค ๊ตฌ๋งคํ๋ฉด ์ค๋ณต ์ํฌํ๋ก์ ๋ญ๋น๋๋ ์์ฐ์ด ๋ฐ์ํฉ๋๋ค.
Fix: CI/CD์๋ Promptfoo(๋ฌด๋ฃ)๋ก ์์ํ์ญ์์ค. ground truth ๋ฐ์ดํฐ์ ์ด ์๋ human-in-the-loop ํ๊ฐ ์บ ํ์ธ์ด ํ์ํ ๋๋ง Braintrust๋ฅผ ์ถ๊ฐํ์ญ์์ค.
โ CI/CD ํ ์คํ ์ ๊ฑด๋๋ฐ๊ณ ํ๋ก๋์ ํ๊ฐ๋ก ๋ฐ๋ก ์ด๋
Why it hurts: ์๋ ํ๊ฐ๋ ์ฃ์ง ์ผ์ด์ค์์ ๋ฐ์ํ๋ ํ๊ท๋ฅผ ๋์นฉ๋๋ค. ํ๋ก๋์ ์คํจ๋ ๋๋ฒ๊น ๋น์ฉ์ด ๋์ต๋๋ค.
Fix: CI/CD์ Promptfoo๋ฅผ ๋จผ์ ์ค์ ํ์ญ์์ค โ ๋ฐฐํฌ๋๊ธฐ ์ ์ ์์๋๋ ๋ณ๊ฒฝ ์ฌํญ์ ๊ฐ์งํฉ๋๋ค. ์คํ๋ผ์ธ ํ๊ฐ ํ์ง ์ธก์ ์ ์ํด Braintrust๋ฅผ ์ถ๊ฐํ์ญ์์ค.
โ ํ๊ท๊ฐ ๊ฐ์ ํ ๋๊น์ง ํ๋กฌํํธ ๋ฒ์ ๊ด๋ฆฌ๋ฅผ ์ถ๊ฐํ์ง ์์
Why it hurts: ๋ฒ์ ๊ด๋ฆฌ ์์ด๋ ์ด๋ค ํ๋กฌํํธ ๋ณ๊ฒฝ์ด ํ๊ท๋ฅผ ์ผ์ผ์ผฐ๋์ง ํ์ธํ๊ฑฐ๋ ์๋ ค์ง ์ข์ ๋ฒ์ ์ผ๋ก ๋กค๋ฐฑํ ์ ์์ต๋๋ค.
Fix: 1์ผ์ฐจ๋ถํฐ PromptHub ๋๋ Vellum์ผ๋ก ๋ฒ์ ๊ด๋ฆฌ๋ฅผ ์ถ๊ฐํ์ญ์์ค. ๊ฐ ํ๋กฌํํธ ๋ณ๊ฒฝ์ ์ฝ๋ ์ปค๋ฐ์ฒ๋ผ ์ทจ๊ธํ์ญ์์ค: ๋ณํฉ ์ ์ ๊ฒํ .
โ AI ํ๋กฌํํธ ๋ชจ๋ํฐ๋ง์ ์ผ๋ฐ ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ(Datadog, New Relic) ์ฌ์ฉ
Why it hurts: ์ผ๋ฐ ๋๊ตฌ๋ ์ง์ฐ ์๊ฐ๊ณผ ์ค๋ฅ๋ฅผ ์ถ์ ํ์ง๋ง ํ๋กฌํํธ ํ ์คํธ, ๋ชจ๋ธ ์๋ต, ํ ํฐ๋น ๋น์ฉ์ ์ถ์ ํ์ง ์์ต๋๋ค โ ํ๋กฌํํธ ๋๋ฒ๊น ์ ํ์ํ ์ ํธ.
Fix: ํ๋ก๋์ ํ๋กฌํํธ ๋ชจ๋ํฐ๋ง์๋ Vellum์ ์ฌ์ฉํ๊ณ LangChain์ ์ฌ์ฉํ๋ค๋ฉด LangSmith๋ฅผ ์ฌ์ฉํ์ญ์์ค. ๋ ๋ค ๋น์ฉ ๊ท์๊ณผ ํจ๊ป ์์ ํ ํ๋กฌํํธ-์๋ต ์์ ๊ธฐ๋กํฉ๋๋ค.
์ง์ญ ๊ท์ ์ค์ ๋ฐ ๋ฐ์ดํฐ ์์ฃผ
๋ฐ์ดํฐ ์์ฃผ ์๊ตฌ ์ฌํญ์ EU, ์๋ฃ, ๊ธ์ต ๋ฐ ๊ท์ ์ฐ์ ์ ํ์์ ์ด๋ค ๋๊ตฌ๊ฐ ์ ํฉํ์ง์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค. ์ ๋ฃ ํ๋์ ์ ํํ๊ธฐ ์ ์ ๊ฒํ ํ์ญ์์ค.
- Braintrust: SOC 2 Type II ์ธ์ฆ. HIPAA Business Associate Agreement(BAA)๋ Enterprise์์ ์ ๊ณต. ๊ธฐ๋ณธ์ ์ผ๋ก ๋ฏธ๊ตญ์ ๋ฐ์ดํฐ ์ ์ฅ. Enterprise์์ ์์ฒด ํธ์คํ ๋ฐฐํฌ ๊ฐ๋ฅ.
- Vellum: ์ํฐํ๋ผ์ด์ฆ ์กฐ๋ฌ์ ์ํ AWS Marketplace์์ ์ด์ฉ ๊ฐ๋ฅ. Enterprise ํ๋์ ์์ฒด ํธ์คํ ๋ฐ ๋ง์ถคํ ๋ฐฐํฌ๋ฅผ ์ง์ํฉ๋๋ค.
- Promptfoo: ์์ ์์ฒด ํธ์คํ โ ๋ฐ์ดํฐ๊ฐ ์ธํ๋ผ๋ฅผ ๋ฒ์ด๋์ง ์์ต๋๋ค. GDPR ๋ฐ ํ๋กฌํํธ ๋ฐ์ดํฐ๋ฅผ SaaS ๊ณต๊ธ์ ์ฒด์ ๊ณต์ ํ ์ ์๋ ๊ท์ ์ฐ์ ํ์ ์ต์ ์ ์ ํ.
- LangSmith: GCP us-central-1์ ๋ฐ์ดํฐ ์ ์ฅ. Enterprise ํ๋์ AWS, GCP ๋๋ Azure์์ ์์ฒด ํธ์คํ ๋ฐ BYOC(Bring Your Own Cloud)๋ฅผ ์ง์ํฉ๋๋ค.
- Confident AI: ์๊ฒฉํ ๋ฐ์ดํฐ ์์ฃผ ์๊ตฌ ์ฌํญ์ด ์๋ ํ์ ์ํด Enterprise ํ๋์์ ์์ฒด ํธ์คํ ๋ฐฐํฌ ์ ๊ณต.
- PromptQuorum: EU์ ํธ์คํ , GDPR ์ค์. ๋ ์ผ ๊ธฐ๋ฐ. ๋ชจ๋ ๋ฐ์ดํฐ๋ EU ์ธํ๋ผ ๋ด์์ ์ฒ๋ฆฌ๋ฉ๋๋ค.
๊ด๋ จ ์๋ฃ
- ํ๋กฌํํธ ํ์ง ํ๊ฐ ๋ฐฉ๋ฒ โ ์ด ๋๊ตฌ๋ค์ด ์ธก์ ํ๋ ๋ฉํธ๋ฆญ: ์ ํ์ฑ, ์ง์ฐ ์๊ฐ, ๋น์ฉ
- ์ต๊ณ ์ ํ๋กฌํํธ ๊ด๋ฆฌ ํ๋ซํผ โ ํ์์ ํ๋กฌํํธ๋ฅผ ๋ฒ์ ๊ด๋ฆฌ, ๊ณต์ , ๊ฑฐ๋ฒ๋์คํ๋ ๋ฐฉ๋ฒ
- Zero-Shot vs Few-Shot ํ๋กฌํํ โ ์์๊ฐ ํ๊ฐ์ ๋์์ด ๋๋ ๊ฒฝ์ฐ์ ํด๋ฅผ ๋ผ์น๋ ๊ฒฝ์ฐ
- Chain-of-Thought ํ๋กฌํํ โ ํ๊ฐ ๋ฉํธ๋ฆญ์ด ๊ฐ์ฅ ์ค์ํ ๋ณต์กํ ์ถ๋ก ์์
- ํ๋กฌํํธ ์ฒด์ด๋ โ LangSmith ํธ๋ ์ด์ฑ์ ์ด์ ์ ๋ฐ๋ ๋ค๋จ๊ณ ์ํฌํ๋ก
- ๋ถ์ ์ ํ๋กฌํํ : AI์๊ฒ ํ์ง ๋ง์์ผ ํ ๊ฒ ์๋ ค์ฃผ๊ธฐ โ ์ด ๋๊ตฌ๋ค์ด ๊ฐ์งํ๋๋ก ์ค๊ณ๋ ํ๊ฐ์ ์ค์ด๋ ์ ์ฝ ๊ธฐ๋ฒ
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
2026๋ ์ต๊ณ ์ ํ๋กฌํํธ ์์ง๋์ด๋ง ๋๊ตฌ 5๊ฐ์ง๋ ๋ฌด์์ ๋๊น?
2026๋ ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๋ 5๊ฐ์ง PE ๋๊ตฌ๋ ํ๊ฐ๋ฅผ ์ํ Braintrust, ํ๋ก๋์ ๋ฐฐํฌ๋ฅผ ์ํ Vellum, ์คํ์์ค CI/CD ํ ์คํ ์ ์ํ Promptfoo, ๋ฒ์ ๊ด๋ฆฌ๋ฅผ ์ํ PromptHub, LangChain ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ์ ์ํ LangSmith์ ๋๋ค. ๊ฐ ๋๊ตฌ๋ ์๋ก ๋ค๋ฅธ ๋ณ๋ชฉ์ ํด๊ฒฐํฉ๋๋ค. ๋๋ถ๋ถ์ ํ์ 5๊ฐ์ง ๋ชจ๋๊ฐ ์๋ 2~3๊ฐ์ง๋ฅผ ์ฌ์ฉํฉ๋๋ค.
ํ๋กฌํํธ ํ๊ฐ์ ๊ฐ์ฅ ์ข์ ๋๊ตฌ๋ ๋ฌด์์ ๋๊น?
Braintrust๋ LLM-as-judge ์ ์ ๋งค๊ธฐ๊ธฐ, ์ธ๊ฐ ํผ๋๋ฐฑ ๋ฃจํ, ground truth ๊ตฌ์ถ์ ์ํ ๋ฐ์ดํฐ์ ๊ด๋ฆฌ ๊ธฐ๋ฅ์ ๊ฐ์ถ ๊ฐ์ฅ ๊ฐ๋ ฅํ ํ๊ฐ ๋๊ตฌ์ ๋๋ค. ํ๊ฐ๋ฅผ ์ ์ํ๊ณ ์๋์ผ๋ก ์คํํ๊ณ ์ธ๊ฐ์ด ์ ์๋ฅผ ๋งค๊ธฐ๊ณ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ๋ฐ์ดํฐ์ ์ผ๋ก ์ปดํ์ผํ ์ ์์ต๋๋ค. Promptfoo๋ CI/CD์์ ํ ์คํธ ๊ธฐ๋ฐ ์๋ํ ํ๊ฐ๋ฅผ ์ํ ๋ฌด๋ฃ ๋์์ ๋๋ค.
ํ ์คํ ์ Promptfoo์ Braintrust ์ค ์ด๋ ๊ฒ์ ์ฌ์ฉํด์ผ ํฉ๋๊น?
CI/CD ํ ์คํ ์๋ Promptfoo๋ฅผ ์ฌ์ฉํ์ญ์์ค โ ๋ฌด๋ฃ, ์คํ์์ค, YAML ๊ตฌ์ฑ์์ ์คํ, GitHub Actions์ ํตํฉ๋ฉ๋๋ค. ์ธ๊ฐ ํผ๋๋ฐฑ์ด ํฌํจ๋ ์คํ๋ผ์ธ ํ๊ฐ๊ฐ ํ์ํ๊ณ ์ ์๊ฐ ์๋ ground truth ๋ฐ์ดํฐ์ ์ ๊ตฌ์ถํ๋ ค๋ฉด Braintrust๋ฅผ ์ฌ์ฉํ์ญ์์ค. ๋ง์ ํ์ด ๋ ๋ค ์ฌ์ฉํฉ๋๋ค: Promptfoo๊ฐ ๋ฐฐํฌ๋ฅผ ์ ์ดํ๊ณ Braintrust๊ฐ ์ถ๋ ฅ ํ์ง์ ์ธก์ ํฉ๋๋ค.
ํ์์ ํ๋กฌํํธ ๋ฒ์ ๊ด๋ฆฌ๊ฐ ํ์ํฉ๋๊น?
์, ํ๋กฌํํธ ๋ฒ์ ๊ด๋ฆฌ๋ ๋ ๋ช ์ด์์ด ํ๋กฌํํธ๋ฅผ ํธ์งํ๋ ์๊ฐ ํ์์ ๋๋ค. ๋ฒ์ ๊ด๋ฆฌ ์์ด๋ ํ์ด ์ด๋ค ๋ฒ์ ์ด ๋ฐฐํฌ๋์๋์ง ์ถ์ ํ๊ฑฐ๋, ํ๊ท ํ ๋กค๋ฐฑํ๊ฑฐ๋, ๋๊ฐ ์ธ์ ๋ฌด์์ ๋ณ๊ฒฝํ๋์ง ๊ฐ์ฌํ ์ ์์ต๋๋ค. PromptHub์ Vellum ๋ชจ๋ ๋ฒ์ ๊ด๋ฆฌ๋ฅผ ์ ๊ณตํฉ๋๋ค. PromptHub๋ ๊ฑฐ๋ฒ๋์ค ์๊ตฌ ์ฌํญ์ด ์๋ ํ์ ๊ฐ์ฅ Git๊ณผ ์ ์ฌํ ์ํฌํ๋ก๋ฅผ ์ ๊ณตํฉ๋๋ค.
์ด ๋๊ตฌ๋ค์ ๋ก์ปฌ ๋ชจ๋ธ์ ์ง์ํฉ๋๊น?
๋๋ถ๋ถ ๋ค์ํ ๊น์ด๋ก ๋ก์ปฌ ๋ชจ๋ธ์ ์ง์ํฉ๋๋ค. Promptfoo๋ wrapper ์์ด ๊ณต๊ธ์ ๊ตฌ์ฑ์ ํตํด Ollama์ LM Studio๋ฅผ ๊ธฐ๋ณธ์ผ๋ก ์ง์ํฉ๋๋ค. Braintrust์ Vellum์ OpenAI ํธํ ์๋ํฌ์ธํธ๋ฅผ ๋ ธ์ถํ๋ API wrapper๋ฅผ ํตํด ๋ก์ปฌ ๋ชจ๋ธ์ ์ง์ํฉ๋๋ค.
์ฌ๋ฌ ํ๋กฌํํธ ์์ง๋์ด๋ง ๋๊ตฌ๋ฅผ ๊ฒฐํฉํ ์ ์์ต๋๊น?
์ โ 2~3๊ฐ์ง ๋๊ตฌ๋ฅผ ๊ฒฐํฉํ๋ ๊ฒ์ด 2026๋ ์ ํ์ค ์ ๊ทผ ๋ฐฉ์์ ๋๋ค. ๊ฐ์ฅ ์ผ๋ฐ์ ์ธ ์คํ์ CI/CD ํ ์คํ ์ ์ํ Promptfoo, ํ๋ก๋์ ๋ฐฐํฌ๋ฅผ ์ํ Vellum, ์คํ๋ผ์ธ ํ๊ฐ ์บ ํ์ธ์ ์ํ Braintrust์ ๋๋ค. ์ธ ๊ฐ์ง ๋ชจ๋ vendor lock-in ์์ด ํ์ค REST API๋ฅผ ํตํด ํตํฉ๋ฉ๋๋ค. Braintrust์ Promptfoo๊ฐ ํ ์คํ ์์ ๋ถ๋ถ์ ์ผ๋ก ๊ฒน์น๊ธฐ ๋๋ฌธ์ 5๊ฐ์ง ๋ชจ๋ ๊ตฌ๋งคํ๋ ๊ฒ์ ํผํ์ญ์์ค.
์ด ๋๊ตฌ๋ค์ ์ผ๋ฐ์ ์ธ ๋น์ฉ์ ์ผ๋ง์ ๋๊น?
2026๋ 5์ ๊ธฐ์ค: Braintrust๋ ๋ฌด๋ฃ ํฐ์ด(100๋ง ์ถ์ , 1๋ง ์ ์, ๋ฌด์ ํ ์ฌ์ฉ์)์ ์ $249 Pro๊ฐ ์์ต๋๋ค. Vellum์ ๋ฌด๋ฃ ํฐ์ด์ ์ $500 Pro๊ฐ ์์ต๋๋ค. Promptfoo๋ ์์ ๋ฌด๋ฃ(์คํ์์ค)์ ๋๋ค. PromptHub๋ ๋ฌด๋ฃ์ด๋ฉฐ Team์ ์ฌ์ฉ์๋น ์ $20์ ๋๋ค. LangSmith Developer๋ $0/์ํธ(์ 5์ฒ ์ถ์ )์ด๋ฉฐ Plus๋ ์ํธ๋น ์ $39์ ๋๋ค. Confident AI๋ ๋ฌด๋ฃ(์ ํ๋จ)์ด๋ฉฐ Starter๋ ์ฌ์ฉ์๋น ์ $19.99์ ๋๋ค. ๋น์ฉ์ ํ๊ฐ ๋ณผ๋ฅจ, API ํธ์ถ ์, ์ํธ ์์ ๋ฐ๋ผ ํ์ฅ๋ฉ๋๋ค.
์ด๋ ๋๊ตฌ์ ๋ฌด๋ฃ ํฐ์ด๊ฐ ๊ฐ์ฅ ์ข์ต๋๊น?
Promptfoo๋ ์์ ๋ฌด๋ฃ ์คํ์์ค์ ๋๋ค โ ์ํธ ์ ํ ์์, ์ฌ์ฉ๋ ์ ํ ์์, ์ธํ๋ผ์์ ์์ฒด ํธ์คํ ๋ฉ๋๋ค. Braintrust๋ ์๊ตฌ ๋ฌด๋ฃ ํฐ์ด๋ฅผ ์ ๊ณตํฉ๋๋ค: 100๋ง ์ถ์ span, 1๋ง ์ ์, ๋ฌด์ ํ ์ฌ์ฉ์. Confident AI ๋ฌด๋ฃ ํฐ์ด๋ ์ฃผ 5ํ ํ ์คํธ ์คํ์ผ๋ก ๋ฌด์ ํ ์ถ์ span์ ํฌํจํฉ๋๋ค. LangSmith Developer๋ $0/์ํธ์ด๋ฉฐ ์ 5์ฒ ์ถ์ ์ ์ ๊ณตํฉ๋๋ค. PromptHub๋ ๋ฌด์ ํ ๋ฉค๋ฒ๋ก ๊ณต๊ฐ ํ๋กฌํํธ์ ๋ฌด๋ฃ์ ๋๋ค.
ํ๋กฌํํธ ํ ์คํ ๊ณผ ํ๊ฐ์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
ํ ์คํ (Promptfoo)์ ํ๋กฌํํธ๊ฐ ์ ์๋ ์ ๋ ฅ์ ๋ํด ์ฌ๋ฐ๋ฅธ ์ถ๋ ฅ์ ์์ฑํ๋์ง ํ์ธํฉ๋๋ค โ CI/CD์์ ์๋์ผ๋ก ์คํ๋๋ฉฐ ํ๊ท๋ฅผ ๊ฐ์งํฉ๋๋ค. ํ๊ฐ(Braintrust)๋ ์ถ๋ ฅ ํ์ง์ ์ธก์ ํฉ๋๋ค โ ์ ํ์ฑ, ์ด์กฐ, ์ฌ์ค์ฑ โ LLM ๋๋ ์ธ๊ฐ ํ์ฌ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ํ ์คํ ์ ๋น ๋ฅด๊ณ ์๋ํ๋ฉ๋๋ค. ํ๊ฐ๋ ๋ ๋๋ฆฌ๊ณ ์ธ๋ฐํฉ๋๋ค. ๋๋ถ๋ถ์ ํ์๋ ๋ ๋ค ํ์ํฉ๋๋ค.
Promptfoo๋ฅผ ๋ฒ์ด๋ Braintrust๊ฐ ํ์ํ ์์ ์ ์ด๋ป๊ฒ ์ ์ ์์ต๋๊น?
ํ์ด pass/fail ์ด์์ผ๋ก ์ถ๋ ฅ ํ์ง์ ์ ์ ๋งค๊ฒจ์ผ ํ ๋ Braintrust๋ก ์ ํํ์ญ์์ค โ ์๋ฅผ ๋ค์ด ์ด์กฐ, ์ฌ์ค์ ์ ํ์ฑ ๋๋ ๋ธ๋๋ ์ ๋ ฌ. Promptfoo๋ CI/CD์์ ์ด์ง ์ ํ์ฑ ํ ์คํธ์ ๋ฐ์ด๋ฉ๋๋ค. Braintrust๋ human-in-the-loop ์ ์ ๋งค๊ธฐ๊ธฐ, LLM ํ์ฌ, ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ๊ฐ์ ๋๋ ground truth ๋ฐ์ดํฐ์ ์ ์ถ๊ฐํฉ๋๋ค. ๋๋ถ๋ถ์ ํ์ 3~5๋ช ์ด ๋งค์ผ ํ๋กฌํํธ๋ฅผ ๋ฐ๋ณตํ ๋ ์ด ๋ณ๊ณก์ ์ ๋๋ฌํฉ๋๋ค.
์ถ์ฒ
- Braintrust ๋ฌธ์ โ ํ๊ฐ ๋ฃจํ, LLM ํ์ฌ, ๋ฐ์ดํฐ์ ๊ด๋ฆฌ์ ๊ดํ ๊ณต์ ๋ฌธ์
- Vellum ํ๋ซํผ โ ํ๋ก๋์ ๋ฐฐํฌ, A/B ํ ์คํ , ๋ชจ๋ํฐ๋ง ๊ธฐ๋ฅ์ด ์๋ Vellum ์ ํ ํ์ด์ง
- Promptfoo GitHub โ YAML ๊ตฌ์ฑ ๋ฌธ์ ๋ฐ red teaming ๊ฐ์ด๋๊ฐ ์๋ ์คํ์์ค ์ ์ฅ์
- PromptHub โ ํ๋กฌํํธ ๋ฒ์ ๊ด๋ฆฌ ๋ฐ ํ ํ์ ํ๋ซํผ
- LangSmith ๋ฌธ์ โ LangChain์ ์ํ ๊ณต์ LangSmith ํธ๋ ์ด์ฑ ๋ฐ ๊ด์ฐฐ ๊ฐ๋ฅ์ฑ ๋ฌธ์
- Confident AI โ 50๊ฐ ์ด์์ ๋ด์ฅ ๋ฉํธ๋ฆญ์ด ์๋ DeepEval ๊ธฐ๋ฐ ํ๊ฐ ๋ฐ red teaming ํ๋ซํผ