ํต์ฌ ์์
- 9๊ฐ ๋ ์ด์ด, 87๊ฐ ํ๋ก์ ํธ, ํ๋์ ์ง๋. ๋ฐํ์, ๋ฐ์คํฌํฑ ์ฑ, ์น UI, ์ฝ๋ฉ ์ด์์คํดํธ, RAG ์์คํ , ์์ด์ ํธ ํ๋ ์์ํฌ, ์์ฑ/๋ฉํฐ๋ชจ๋ฌ, ๋ชจ๋ฐ์ผ ํด๋ผ์ด์ธํธ, ์ ๋ฌธ ์์ฐ์ฑ ํ๋ฌ๊ทธ์ธ โ 2026๋ ์ ๊ฑฐ์ ๋ชจ๋ ์ธ๊ธฐ ํ๋ก์ ํธ๋ ์ ํํ ํ๋์ ๋ ์ด์ด์ ์ํฉ๋๋ค.
- ๋จผ์ ๋ฐํ์์ ์ ํํ์ญ์์ค. Ollama๋ ๋ ์์ ~95%์๊ฒ ์ ํฉํ ๊ธฐ๋ณธ ์ ํ์ ๋๋ค. llama.cpp๋ ๋๋ถ๋ถ์ ๋ค๋ฅธ ๋๊ตฌ ๋ค์ ์๋ ๊ธฐ๋ฐ ์์ง์ด๋ฉฐ, vLLM์ ์ค์ GPU์์ ๋ฉํฐ์ ์ ๋ฐฐํฌ ์ ํ๋ก๋์ ์ ํ์ ๋๋ค.
- ๋ฐํ์ ์์ ๋๋ถ๋ถ ๋ ์ด์ด๋ ์ ํ์ ์ ๋๋ค. ์ฑํ ์๋ ๋ฐ์คํฌํฑ ์ฑ OR ์น UI ํ๋๋ก ์ถฉ๋ถํฉ๋๋ค. IDE ์ฐ๋์ด ํ์ํ ๋๋ง ์ฝ๋ฉ ์ด์์คํดํธ๋ฅผ ์ถ๊ฐํ๊ณ , ์์ ์ ๋ฌธ์์ ๋ํํ ๋๋ง RAG ์์คํ ์, ๋จ์ผ ๋จ๊ณ ํธ์ถ๋ก ์ถฉ๋ถํ์ง ์์ ๋๋ง ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ์ถ๊ฐํ์ญ์์ค.
- ์์ ์ ์ฌ์ฉ ์ ๋ผ์ด์ ์ค๊ฐ ์ค์ํฉ๋๋ค. MIT์ Apache 2.0์ด ์ํ๊ณ๋ฅผ ์ง๋ฐฐํฉ๋๋ค. AGPL์ ์ผ๋ถ ์ธํฐํ์ด์ค(text-generation-webui, KoboldCpp, Jan, SillyTavern)์ ์ ์ฉ๋ฉ๋๋ค โ ๊ฐ์ธ ์ฌ์ฉ์๋ ์ ํฉํ์ง๋ง ์์ ์ ๋ฐฐํฌ ์์๋ ๋ ์ ์คํ๊ฒ ๊ฒํ ํด์ผ ํฉ๋๋ค.
- ๋ฉํฐํด ์คํ์ด ์ผ๋ฐ์ ์ ๋๋ค. Ollama + Open WebUI + AnythingLLM + Continue.dev๋ ์ฑํ , RAG, ์ฝ๋ฉ์ ํํ ์์ด ์ปค๋ฒํ๋ ๋จ์ผ ๋จธ์ ๊ตฌ์ฑ์ ๋๋ค. ์๋์ "์ค์ ์ฌ์ฉ ์คํ" ํ์ 2026๋ ์ ์ค์ ๋ก ์๋ํ๋ ๋ ์ํผ๊ฐ ๋์ด๋์ด ์์ต๋๋ค.
๐ ํ ๋ฌธ์ฅ์ผ๋ก
2026๋ ๋ก์ปฌ LLM ์ํ๊ณ๋ ๋ฐํ์, ๋ฐ์คํฌํฑ ์ฑ, ์น UI, ์ฝ๋ฉ ์ด์์คํดํธ, RAG ์์คํ , ์์ด์ ํธ ํ๋ ์์ํฌ, ์์ฑ/๋ฉํฐ๋ชจ๋ฌ, ๋ชจ๋ฐ์ผ ํด๋ผ์ด์ธํธ, ์ ๋ฌธ ๋๊ตฌ์ 9๊ฐ ๋ ์ด์ด์ ๊ฑธ์ณ 87๊ฐ์ ํ์ฑ ํ๋ก์ ํธ๋ฅผ ๋ณด์ ํ๊ณ ์์ต๋๋ค.
๐ฌ ์ฝ๊ฒ ๋งํ๋ฉด
๋ก์ปฌ LLM ์ํํธ์จ์ด๋ ์ธํฐ๋ท ์์ด ๊ฐ์ธ ์ปดํจํฐ์์ AI๋ฅผ ์คํํ๋ ๋๊ตฌ์ ๋๋ค. Ollama ๊ฐ์ ๋ฐํ์์ด ๋ชจ๋ธ์ ๋ก๋ํ๊ณ , LM Studio ๊ฐ์ ์ฑ์ด ์ฑํ ํ๋ฉด์ ์ ๊ณตํ๋ฉฐ, AnythingLLM ๊ฐ์ ๋๊ตฌ๋ ์ฌ์ฉ์ ๋ฌธ์๋ฅผ ์ฐธ์กฐํ ์ ์๊ฒ ํฉ๋๋ค.
1. ๋ก์ปฌ LLM ๋ฐํ์ ๋ฐ ์ถ๋ก ์์ง
๋ฐํ์์ ๋ชจ๋ธ ๊ฐ์ค์น๋ฅผ ๋ฉ๋ชจ๋ฆฌ์ ๋ก๋ํ๊ณ ํ๋กฌํํธ๋ฅผ ํ ํฐ์ผ๋ก ๋ณํํ๋ ์์ง์ ๋๋ค. ๋ก์ปฌ LLM ์คํ์์ ์ฒซ ๋ฒ์งธ ๊ฒฐ์ ์ด๋ฉฐ ๊ทธ ์์ ๋ชจ๋ ๊ฒ์ ๊ฒฐ์ ํฉ๋๋ค โ ๋ฐ์คํฌํฑ ์ฑ, ์น UI, ์ฝ๋ฉ ์ด์์คํดํธ๋ ๋ชจ๋ ๊ฒฐ๊ตญ ๋ฐํ์์ ํธ์ถํฉ๋๋ค. Ollama๋ 2026๋ ์ฌ์ฉ์ ์งํฅ ์์ฅ ์ ์ ์จ์ ์ง๋ฐฐํฉ๋๋ค. OpenAI ํธํ API์ ๋จ์ผ ๋ช ๋ น ์ค์น๋ฅผ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์ ๋๋ค. llama.cpp๋ ๋๋ถ๋ถ์ ๋ค๋ฅธ ๋๊ตฌ ๊ธฐ๋ฐ์ ์๋ C++ ์์ง์ด๋ฉฐ, vLLM์ ์ค์ GPU์์ ๋์ ์ฌ์ฉ์๋ฅผ ์๋น์คํด์ผ ํ ๋ ์ ํฉํ ์ ํ์ ๋๋ค.
| ๋๊ตฌ | ๋งํฌ | ์ค๋ช | ๋ผ์ด์ ์ค |
|---|---|---|---|
| Ollama | ollama.com | ์ ๋ฐ์ ์ผ๋ก ๊ฐ์ฅ ์ฌ์ด โ ๋จ์ผ ๋ช ๋ น ์ค์น, OpenAI ํธํ API, ๋ํ ๋ชจ๋ธ ๋ผ์ด๋ธ๋ฌ๋ฆฌ | MIT |
| llama.cpp | github.com/ggml-org/llama.cpp | ๋๋ถ๋ถ์ ๋ค๋ฅธ ๋๊ตฌ ๊ธฐ๋ฐ์ ์๋ C++ ์์ง, Apple Silicon ํฌํจ ์ด๋์๋ ๋์ | MIT |
| vLLM | github.com/vllm-project/vllm | ๋ฉํฐ์ ์ GPU ๋ฐฐํฌ๋ฅผ ์ํ ๊ณ ์ฑ๋ฅ ์๋น | Apache 2.0 |
| LocalAI | localai.io | ์ฌ๋ฌ ๋ฐฑ์๋๋ฅผ ์ง์ํ๋ OpenAI API ๋๋กญ์ธ ๋์ฒด | MIT |
| TensorRT-LLM | github.com/NVIDIA/TensorRT-LLM | ์ํฐํ๋ผ์ด์ฆ GPU ๊ตฌ์ฑ์ ์ํ NVIDIA ์ต์ ํ ์ถ๋ก | Apache 2.0 |
| MLC LLM | mlc.ai/mlc-llm | ๋ชจ๋ฐ์ผ ๋ฐ ์ฃ์ง ๋๋ฐ์ด์ค์ฉ ๋ฐฐํฌ ๋ฐํ์ | Apache 2.0 |
| SGLang | github.com/sgl-project/sglang | ์์ด์ ํธ ํ์ดํ๋ผ์ธ์ ์ํ ๊ตฌ์กฐํ ์ถ๋ก ์๋น | Apache 2.0 |
| ExLlamaV2 | github.com/turboderp-org/exllamav2 | RTX GPU์ ์ต์ ํ๋ ๋น ๋ฅธ ์์ํ ์ถ๋ก | MIT |
| KoboldCpp | github.com/LostRuins/koboldcpp | ๋ด์ฅ ์ธํฐํ์ด์ค๊ฐ ํฌํจ๋ llama.cpp ๊ฒฝ๋ ๋ํผ | AGPL 3.0 |
| Llamafile | github.com/Mozilla-Ocho/llamafile | Mozilla์ ๋จ์ผ ํ์ผ ํฌํฐ๋ธ LLM ์คํ | Apache 2.0 |
| MLX-LM | github.com/ml-explore/mlx-examples | Apple Research์ Apple Silicon ๋ค์ดํฐ๋ธ ๋ฐํ์ | MIT |
์์ธ ๋น๊ต ๊ฐ์ด๋: llama.cpp vs Ollama vs vLLM
2. ๋ฐ์คํฌํฑ ์ฑ (GUI)
๋ฐ์คํฌํฑ ์ฑ์ ๋ฐํ์์ ์ฑํ ์ธํฐํ์ด์ค์ ๋ชจ๋ธ ํ์๊ธฐ๋ก ๊ฐ์๋๋ค. ํฐ๋ฏธ๋ ๋จ๊ณ๊ฐ ์๊ธฐ ๋๋ฌธ์ ๋๋ถ๋ถ์ ๋น๊ธฐ์ ์ ์ฌ์ฉ์๊ฐ ์์ํ๋ ๊ณณ์ ๋๋ค โ ๋ค์ด๋ก๋, ํด๋ฆญ, ์ฑํ . LM Studio, Jan, GPT4All์ด 2026๋ ์ฌ์ฉ์ ๊ธฐ๋ฐ์ ๋๋ถ๋ถ์ ์ฐจ์งํฉ๋๋ค. AnythingLLM์ ๋ฐ์คํฌํฑ ์ฑ์ด์ RAG ๋ ์ด์ด๋ก๋ ๊ธฐ๋ฅํ๋ฉฐ, Open Interpreter๋ ๋ก์ปฌ ๋ชจ๋ธ์ด ์ปดํจํฐ๋ฅผ ์ ์ดํ๋๋ก ํ์ฉํ๋ ํน์ํ ๊ฒฝ์ฐ์ ๋๋ค.
| ๋๊ตฌ | ๋งํฌ | ์ค๋ช | ๋ผ์ด์ ์ค |
|---|---|---|---|
| LM Studio | lmstudio.ai | ๊ฐ์ฅ ์ธ๋ จ๋ GUI, HuggingFace ๋ชจ๋ธ ํ์๊ธฐ ๋ด์ฅ, ์๋ฒ ๋ชจ๋ | ๋ฌด๋ฃ(๋น๊ณต๊ฐ) |
| Jan | jan.ai | ํ๋ผ์ด๋ฒ์ ์ค์ฌ์ ์คํ๋ผ์ธ ChatGPT ํด๋ก , ์์ ์คํ์์ค | AGPL 3.0 |
| GPT4All | nomic.ai/gpt4all | ๊ฐ๋ ฅํ CPU ์ ์ฉ ์ง์์ ๊ฐ์ถ ์ ๋ฌธ์ ์นํ์ ์ฑ | MIT |
| AnythingLLM | anythingllm.com | ๋ด์ฅ ๋ฒกํฐ ์ ์ฅ์๋ฅผ ๊ฐ์ถ RAG ๋ฐ ๋ฌธ์ ์ฑํ | MIT |
| Msty | msty.app | ๊น๋ํ ์๋น์ UX, ๋ฉํฐ ์ ๊ณต์ ์ง์ | ๋ฌด๋ฃ(๋น๊ณต๊ฐ) |
| Cherry Studio | cherry-ai.com | ๊ด๋ฒ์ํ ์ปค์คํฐ๋ง์ด์ง์ ๊ฐ์ถ ๋ฉํฐ ์ ๊ณต์ ๋ฐ์คํฌํฑ AI | AGPL 3.0 |
| Backyard AI | backyard.ai | ์บ๋ฆญํฐ ์ฑํ ๋ฐ ๋กคํ๋ ์ด์ฉ ๋ฐ์คํฌํฑ ํด๋ผ์ด์ธํธ | ๋ฌด๋ฃ(๋น๊ณต๊ฐ) |
| Enchanted | github.com/AugustDev/enchanted | ์ต์ํ์ macOS/iOS ๋ค์ดํฐ๋ธ Ollama ํด๋ผ์ด์ธํธ | Apache 2.0 |
| h2oGPT | github.com/h2oai/h2ogpt | ๋ง์ ์ํฐํ๋ผ์ด์ฆ ๊ธฐ๋ฅ์ ๊ฐ์ถ ๋ฐ์คํฌํฑ ๋ฐ ์๋ฒ | Apache 2.0 |
| Open Interpreter | github.com/OpenInterpreter/open-interpreter | ๋ก์ปฌ LLM์ด ์ปดํจํฐ๋ฅผ ์ ์ดํ๊ณ ์ฝ๋๋ฅผ ์คํํ๋๋ก ํ์ฉ | AGPL 3.0 |
์์ธ ๋น๊ต ๊ฐ์ด๋: LM Studio vs Jan vs GPT4All
3. ์น UI ๋ฐ ๋ธ๋ผ์ฐ์ ํ๋ฐํธ์๋
์น UI๋ ์ ํํธ์คํ ChatGPT ํด๋ก ์ ๋๋ค โ ๋์ผํ ๋ํ ์ธํฐํ์ด์ค์ง๋ง, ์ง์ ์์ ํ ๋จธ์ ์ด๋ LAN์์ ์คํ๋๋ ๋ฐํ์์ ๊ฐ๋ฆฌํต๋๋ค. ๋ฉํฑ, ํฐ, ํ๋ธ๋ฆฟ์ด ์๋ฒ๋ฅผ ๊ฐ๋ฆฌํค๋ ๋ฉํฐ๋๋ฐ์ด์ค ์ ๊ทผ์ด๋ ํ ์ฌ์ฉ์ ์์ฐ์ค๋ฌ์ด ์ ํ์ ๋๋ค. Open WebUI๋ 2026๋ ์ ํํธ์คํ ์ธ๊ทธ๋จผํธ๋ฅผ ์ง๋ฐฐํ๋ฉฐ, LibreChat์ ํ ๊ธฐ๋ฅ ๋์, SillyTavern์ ์ ์ฉ ๋กคํ๋ ์ด ์ธํฐํ์ด์ค์ ๋๋ค.
| ๋๊ตฌ | ๋งํฌ | ์ค๋ช | ๋ผ์ด์ ์ค |
|---|---|---|---|
| Open WebUI | openwebui.com | ๊ฐ์ฅ ์ธ๊ธฐ ์๋ ChatGPT ์คํ์ผ ์ ํํธ์คํ ์ธํฐํ์ด์ค, RAG ๋ด์ฅ | BSD 3-Clause |
| LibreChat | librechat.ai | ํ ๊ธฐ๋ฅ์ ๊ฐ์ถ ๋ฉํฐ๋ชจ๋ธ ChatGPT ๋์ | MIT |
| text-generation-webui | github.com/oobabooga/text-generation-webui | ๋ฐฉ๋ํ ํ๋ฌ๊ทธ์ธ ์ํ๊ณ๋ฅผ ๊ฐ์ถ ํ์์ ์ ์ฉ ์ธํฐํ์ด์ค | AGPL 3.0 |
| SillyTavern | github.com/SillyTavern/SillyTavern | ๋ก์ด๋ถ์ด ์๋ ๋กคํ๋ ์ด ๋ฐ ์บ๋ฆญํฐ ์ฑํ | AGPL 3.0 |
| LobeChat | lobehub.com | ํ๋ฌ๊ทธ์ธ ๋ง์ผํ๋ ์ด์ค๊ฐ ์๋ ํ๋์ ์ด๊ณ ์ธ๋ จ๋ ์ธํฐํ์ด์ค | MIT |
| Big-AGI | github.com/enricoros/big-AGI | ํ๋ฅด์๋๊ฐ ์๋ ๊ณ ๊ธ ๋ฉํฐ ์ ๊ณต์ ํ๋ฐํธ์๋ | MIT |
| NextChat | github.com/ChatGPTNextWeb/NextChat | ๊ฐ๋จํ ๋ฐฐํฌ๊ฐ ๊ฐ๋ฅํ ๊ฒฝ๋ ์น ์ฑํ | MIT |
| Page Assist | github.com/n4ze3m/page-assist | Chrome ๋ฐ Firefox์ฉ ๋ธ๋ผ์ฐ์ ์ฌ์ด๋๋ฐ AI | MIT |
| Chatbox | chatboxai.app | ํฌ๋ก์คํ๋ซํผ ๋ฐ์คํฌํฑ ๋ฐ ์น ํด๋ผ์ด์ธํธ | GPLv3 |
์์ธ ๋น๊ต ๊ฐ์ด๋: SillyTavern vs Agnai vs RisuAI
4. ์ฝ๋ฉ ์ด์์คํดํธ ๋ฐ IDE ์ฐ๋
์ฝ๋ฉ ์ด์์คํดํธ๋ OpenAI ํธํ API๋ฅผ ํตํด ๋ก์ปฌ LLM์ ํธ์ง๊ธฐ๋ ํฐ๋ฏธ๋์ ์ฐ๊ฒฐํฉ๋๋ค. ์ ํ์ ์ฃผ๋ก ์ํฌํ๋ก์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋๋ค: ํธ์ง๊ธฐ ๋ด ์๋ ์์ฑ(Continue.dev), ์์จ ์์ด์ ํธ ํธ์ง(Cline, OpenHands), ๋๋ ํฐ๋ฏธ๋์์ git ๋ค์ดํฐ๋ธ diff ํธ์ง(Aider). ์ธ ํจํด ๋ชจ๋ OpenAI Chat Completions ํ๋กํ ์ฝ์ ์ง์ํ๋ ๋ฐํ์์์ ์๋ํฉ๋๋ค โ 2026๋ ์๋ Ollama๊ฐ ๊ฐ์ฅ ์ผ๋ฐ์ ์ธ ๋ฐฑ์๋์ ๋๋ค.
| ๋๊ตฌ | ๋งํฌ | ์ค๋ช | ๋ผ์ด์ ์ค |
|---|---|---|---|
| Continue.dev | continue.dev | ๋ก์ปฌ ๋ชจ๋ธ๋ก VS Code ๋ฐ JetBrains์์ ์๋ ์์ฑ ๋ฐ ์ฑํ | Apache 2.0 |
| Aider | aider.chat | ๋ฉํฐํ์ผ ํธ์ง ์ง์์ ๊ฐ์ถ ํฐ๋ฏธ๋ ํ์ด ํ๋ก๊ทธ๋๋จธ | Apache 2.0 |
| Cline | cline.bot | VS Code์ฉ ์์จ ์ฝ๋ ์์ด์ ํธ | Apache 2.0 |
| Tabby | tabby.tabbyml.com | GitHub Copilot์ ์ ํํธ์คํ ๋์ | Apache 2.0 |
| CodeGPT | codegpt.co | ์ฌ๋ฌ ํธ์ง๊ธฐ๋ฅผ ์ํ IDE ์ฐ๋ | MIT |
| OpenHands | github.com/All-Hands-AI/OpenHands | AI ์ํํธ์จ์ด ๊ฐ๋ฐ ์์ด์ ํธ (์ด์ ์ด๋ฆ: OpenDevin) | MIT |
| Cursor (๋ก์ปฌ ๋ชจ๋) | cursor.com | ๋ก์ปฌ ๋ชจ๋ธ ์ง์์ ๊ฐ์ถ AI ์ค์ฌ ์ฝ๋ ํธ์ง๊ธฐ | ๋ฌด๋ฃ(๋น๊ณต๊ฐ) |
| Twinny | github.com/twinnydotdev/twinny | VS Code์ฉ ๋ฌด๋ฃ Copilot ๋์ | MIT |
์์ธ ๋น๊ต ๊ฐ์ด๋: Continue.dev vs Cline vs Aider
5. RAG ์์คํ ๋ฐ ๋ฌธ์ ์ฑํ
RAG (Retrieval-Augmented Generation) ์์คํ ์ ๋ก์ปฌ LLM์ ์๋ฒ ๋ฉ ๋ชจ๋ธ ๋ฐ ๋ฒกํฐ ์ ์ฅ์์ ๊ฒฐํฉํ์ฌ ๋ชจ๋ธ์ด ์ฌ์ฉ์ ์์ ์ ๋ฌธ์์์ ๋ต๋ณํ ์ ์๊ฒ ํฉ๋๋ค.** "๊ทธ๋ฅ ์๋ํ๋" ํดํค ์ฑ(AnythingLLM, PrivateGPT, Quivr, Khoj)๊ณผ ๊ตฌ์ถ์ ๊ธฐ๋ฐ์ด ๋๋ ํ๋ ์์ํฌ ๋ผ์ด๋ธ๋ฌ๋ฆฌ(LlamaIndex, Haystack, txtai)๋ก ๋๋ฉ๋๋ค. RAGFlow๋ ํนํ ๊ณ ํ์ง ์ธ์ฉ ์ถ์ถ์ด ํ์ํ ๋ฌธ์์ ๋ํด 2026๋ ์ ์ ์ ์จ์ ๋๋ฆฌ๊ณ ์์ต๋๋ค.
| ๋๊ตฌ | ๋งํฌ | ์ค๋ช | ๋ผ์ด์ ์ค |
|---|---|---|---|
| AnythingLLM | anythingllm.com | ์ํฌ์คํ์ด์ค๊ฐ ์๋ ๊ฐ์ฅ ์ฌ์ด ์ฌ์ธ์ ๊ฐ์ธ RAG | MIT |
| PrivateGPT | github.com/zylon-ai/private-gpt | ๊ธฐ์ ์งํฅ์ ์์ ์คํ๋ผ์ธ RAG | Apache 2.0 |
| Quivr | github.com/QuivrHQ/quivr | ์ ํํธ์คํ ๊ฐ์ธ ์ง์ ์ด์์คํดํธ | Apache 2.0 |
| Khoj | khoj.dev | Obsidian ๋ฐ Notion๊ณผ ๋๊ธฐํ๋๋ ๊ฐ์ธ AI ์ 2์ ๋ | AGPL 3.0 |
| Dify | dify.ai | RAG ๋ฐ ์์ด์ ํธ ์ง์์ ๊ฐ์ถ AI ์ํฌํ๋ก ๋น๋ | Modified Apache 2.0 |
| Flowise | flowiseai.com | ์๊ฐ์ LangChain ์ํฌํ๋ก ๋น๋ | Apache 2.0 |
| Langflow | langflow.org | RAG ์ปดํฌ๋ํธ๋ฅผ ๊ฐ์ถ ์๊ฐ์ AI ์ค์ผ์คํธ๋ ์ด์ | MIT |
| LlamaIndex | llamaindex.ai | RAG ํ๋ ์์ํฌ / Python ๋ผ์ด๋ธ๋ฌ๋ฆฌ โ ๋ง์ถคํ ๊ฐ๋ฐ์ ๊ธฐ๋ฐ | MIT |
| Haystack | haystack.deepset.ai | deepset์ ๊ฒ์ ๋ฐ RAG ํ๋ ์์ํฌ | Apache 2.0 |
| RAGFlow | ragflow.io | ์ธ์ฉ ์ถ์ถ ๊ธฐ๋ฅ์ด ์๋ ๋ฌธ์ ์ฌ์ธต ์ดํด RAG | Apache 2.0 |
| txtai | github.com/neuml/txtai | ๋จ์ผ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ํตํฉ๋ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค + LLM | Apache 2.0 |
์์ธ ๋น๊ต ๊ฐ์ด๋: AnythingLLM vs PrivateGPT vs Open WebUI
6. ์์ด์ ํธ ํ๋ ์์ํฌ ๋ฐ ์ค์ผ์คํธ๋ ์ด์
์์ด์ ํธ ํ๋ ์์ํฌ๋ LLM์ ๋ํ ๋จ์ผ ๋จ๊ณ ํธ์ถ์ ๋ฉํฐ์คํ ์ํฌํ๋ก(๊ณํ, ํ๋, ๊ด์ฐฐ, ๋ฐ๋ณต)๋ก ์ ํํฉ๋๋ค. LangChain์ ์ฌ์ ํ ๋ฒ์ฉ ํ์ค์ ๋๋ค. CrewAI์ AutoGen์ ์ญํ ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ ์ค์ ์ ํนํ๋์ด ์์ต๋๋ค. LangGraph๋ ์ฅ๊ธฐ ์คํ ํ๋ฆ์์ ์ํ ๊ด๋ฆฌ๊ฐ ์ค์ํ ๋ ์ฌ๋ฐ๋ฅธ ์ ํ์ ๋๋ค. ์๋ 8๊ฐ ํ๋ ์์ํฌ ๋ชจ๋ Ollama ๋ก์ปฌ ๋ฐฑ์๋์ ์ํํ๊ฒ ์๋ํฉ๋๋ค.
| ๋๊ตฌ | ๋งํฌ | ์ค๋ช | ๋ผ์ด์ ์ค |
|---|---|---|---|
| LangChain | langchain.com | ๋ฒ์ฉ LLM ์ ํ๋ฆฌ์ผ์ด์ ํ๋ ์์ํฌ | MIT |
| LlamaIndex | llamaindex.ai | RAG ์ค์ฌ์ ์์ด์ ํธ ๋ฐ ๋ฐ์ดํฐ ํ๋ ์์ํฌ | MIT |
| CrewAI | crewai.com | ์ญํ ๊ธฐ๋ฐ ๋ฉํฐ์์ด์ ํธ ์ํฌํ๋ก | MIT |
| AutoGen | github.com/microsoft/autogen | Microsoft์ ๋ฉํฐ์์ด์ ํธ ์ค์ผ์คํธ๋ ์ด์ ํ๋ ์์ํฌ | CC-BY-4.0 / MIT |
| Semantic Kernel | learn.microsoft.com/semantic-kernel | C#/Python/Java์ฉ Microsoft ์ํฐํ๋ผ์ด์ฆ ์ค์ผ์คํธ๋ ์ด์ SDK | MIT |
| LangGraph | langchain-ai.github.io/langgraph | ์ํ๋ฅผ ๊ฐ์ถ ๊ทธ๋ํ ๊ธฐ๋ฐ ์์ด์ ํธ ์ํฌํ๋ก | MIT |
| Letta (์ด์ ์ด๋ฆ: MemGPT) | letta.com | ์ฅ๊ธฐ ๊ธฐ์ต์ ๊ฐ์ถ ์์ด์ ํธ | Apache 2.0 |
| Pydantic AI | ai.pydantic.dev | Pydantic ์์ ๊ตฌ์ถ๋ ํ์ ์์ ์์ด์ ํธ ํ๋ ์์ํฌ | MIT |
์์ธ ๋น๊ต ๊ฐ์ด๋: ๋ก์ปฌ AI ์์ด์ ํธ์ MCP
7. ์์ฑ, ์คํผ์น, ๋ฉํฐ๋ชจ๋ฌ
์์ฑ ๋ฐ ๋ฉํฐ๋ชจ๋ฌ ์คํ์ ๋ก์ปฌ LLM์ ํ ์คํธ ๋๋จธ๋ก ํ์ฅํฉ๋๋ค โ ์์ฑ ์ ๋ ฅ(STT), ์์ฑ ์ถ๋ ฅ(TTS), ๋น์ . Whisper.cpp์ faster-whisper๋ ๋ก์ปฌ STT ๋ ์ด์ด๋ฅผ ์์ ํฉ๋๋ค. Piper์ Coqui๋ XTTS v2๊ฐ ์์ฑ ๋ณต์ ๋ฅผ ์ง๋ฐฐํ๋ฉฐ TTS ๋ ์ด์ด๋ฅผ ๊ณต์ ํฉ๋๋ค. LLaVA์ Ollama ๋น์ ๋ชจ๋ธ์ ์๊ฐ ์ธก๋ฉด์ ๋ด๋นํฉ๋๋ค. ์์ ์คํ๋ผ์ธ ์์ฑ ์ด์์คํดํธ๋ ์ด ๋ ์ด์ด์ ์ํ ์ฑํ ๋ชจ๋ธ๋ก ๊ตฌ์ถํ ์ ์์ต๋๋ค.
| ๋๊ตฌ | ๋งํฌ | ์ค๋ช | ๋ผ์ด์ ์ค |
|---|---|---|---|
| Whisper.cpp | github.com/ggerganov/whisper.cpp | ๋ก์ปฌ ์์ฑ ์ธ์, CPU ๋๋ GPU์์ ๋์ | MIT |
| faster-whisper | github.com/SYSTRAN/faster-whisper | CTranslate2๋ฅผ ํตํ ๋น ๋ฅธ Whisper ์ ์ฌ | MIT |
| Piper TTS | github.com/rhasspy/piper | ๊ฒฝ๋ ๋ก์ปฌ ํ ์คํธ ์์ฑ ๋ณํ | MIT |
| Coqui TTS | github.com/idiap/coqui-ai-TTS | ์ฌ๋ฌ ๋ชจ๋ธ ์ต์ ์ ๊ฐ์ถ ์คํ์์ค ์์ฑ ํฉ์ฑ | MPL 2.0 |
| XTTS v2 | huggingface.co/coqui/XTTS-v2 | ๋ค๊ตญ์ด ์ง์์ ๊ฐ์ถ ์์ฑ ๋ณต์ | CPML |
| Bark | github.com/suno-ai/bark | ๋น์์ฑ ์ฌ์ด๋๋ฅผ ํฌํจํ ์์ฑ์ ์์ฑ | MIT |
| StyleTTS 2 | github.com/yl4579/StyleTTS2 | ์์ฐ์ค๋ฝ๊ฒ ๋ค๋ฆฌ๋ ๊ณ ํ์ง TTS | MIT |
| LLaVA | llava-vl.github.io | ๋ก์ปฌ ๋น์ + ์ธ์ด ๋ชจ๋ธ | Apache 2.0 |
| Ollama ๋น์ ๋ชจ๋ธ | ollama.com | Ollama๋ฅผ ํตํ ๋ก์ปฌ ๋น์ (Llama 3.2 Vision, Llava ๋ฑ) | ๋ค์ |
์์ธ ๋น๊ต ๊ฐ์ด๋: ์ค๋งํธํฐ์์ ๋ก์ปฌ ์์ฑ ์ด์์คํดํธ ๊ตฌ์ถ
8. ๋ชจ๋ฐ์ผ ๋ฐ ์ฃ์ง ํด๋ผ์ด์ธํธ
๋ชจ๋ฐ์ผ ํด๋ผ์ด์ธํธ๋ Apple Neural Engine, Qualcomm NPU ๋๋ ์์ CPU ์ถ๋ก ์ ์ฌ์ฉํ์ฌ ์์ํ๋ ๋ชจ๋ธ์ ์ค๋งํธํฐ์์ ์ง์ ์คํํฉ๋๋ค. MLC LLM ํ๋ก์ ํธ๊ฐ ๊ธฐ๋ฐ ๋ ์ด์ด์ด๋ฉฐ, ์๋น์ ์ฑ(PocketPal AI, Private LLM, LLM Farm, Layla)์ด ์ฑํ ์ธํฐํ์ด์ค๋ก ๊ฐ์๋๋ค. 2026๋ ํ๋๊ทธ์ญ ํฐ์ ์ค์ฉ์ ์ธ ์๋(8-15 ํ ํฐ/์ด)๋ก 2-4B ๋ชจ๋ธ์ ์คํํฉ๋๋ค. 7B๋ ์ต๊ณ ๊ธ ํ๋์จ์ด์์ ๊ฐ๋ฅํฉ๋๋ค.
| ๋๊ตฌ | ๋งํฌ | ์ค๋ช | ๋ผ์ด์ ์ค |
|---|---|---|---|
| MLC Chat | mlc.ai/mlc-llm | ํฌ๋ก์คํ๋ซํผ ๋ชจ๋ฐ์ผ LLM ๋ฐํ์ | Apache 2.0 |
| PocketPal AI | github.com/a-ghorbani/pocketpal-ai | iOS ๋ฐ Android์ฉ ๋ฌด๋ฃ ๋ก์ปฌ LLM ํด๋ผ์ด์ธํธ | MIT |
| Private LLM | privatellm.app | iOS ๋ฐ macOS์ฉ ์ธ๋ จ๋ ๋ก์ปฌ LLM ์ฑ | ์ ๋ฃ(๋น๊ณต๊ฐ) |
| LLM Farm | github.com/guinmoon/LLMFarm | ๋ชจ๋ธ ํ์๊ธฐ๊ฐ ์๋ iOS์ฉ ๋ก์ปฌ LLM | MIT |
| Layla | layla-network.ai | Android ์ค์ฌ ๋ก์ปฌ LLM ์ฑ | ๋ฌด๋ฃ(๋น๊ณต๊ฐ) |
| Maid | github.com/Mobile-Artificial-Intelligence/maid | LLM์ฉ ์คํ์์ค Flutter ๋ชจ๋ฐ์ผ ์ฑ | MIT |
| Enchanted | github.com/AugustDev/enchanted | iOS/macOS ๋ค์ดํฐ๋ธ Ollama ํด๋ผ์ด์ธํธ | Apache 2.0 |
| Chapper | prevolut.uk | Ollama ๋ฐ LM Studio์ฉ ๋ค์ดํฐ๋ธ ๋ชจ๋ฐ์ผ ํด๋ผ์ด์ธํธ | ๋ฌด๋ฃ |
| RikkaHub | github.com/rikkahub/rikkahub | ์คํ์์ค Android ๋ก์ปฌ AI | MIT |
| AnythingLLM Mobile | anythingllm.com | ๋ก์ปฌ AnythingLLM ์ํฌ์คํ์ด์ค์ ๋ํ ์๊ฒฉ ์ ๊ทผ | MIT |
์์ธ ๋น๊ต ๊ฐ์ด๋: 2026๋ iPhone์ฉ ์ต๊ณ ์ ๋ก์ปฌ LLM ์ฑ
9. ์ ๋ฌธ ๋ฐ ์์ฐ์ฑ ๋๊ตฌ
์ ๋ฌธ ๋๊ตฌ๋ ๋ก์ปฌ LLM์ ์ด๋ฏธ ์ฌ์ฉ ์ค์ธ ์ฑ์ ํตํฉํฉ๋๋ค โ ๋ ธํธ ํ๋ซํผ(Obsidian, Logseq, Joplin), ์์จ ์์ ์์ด์ ํธ(AutoGPT, BabyAGI, MetaGPT), ๋กคํ๋ ์ด ํ๋ฐํธ์๋(Agnai, RisuAI). ๋ฒ์ฉ ์ฑํ ์ธํฐํ์ด์ค๊ฐ ์๋๋๋ค. ํธ์คํธ ์ฑ๊ณผ ๋ฐํ์์ ์ด๋ฏธ ๋ณด์ ํ๊ณ ์๋ค๊ณ ๊ฐ์ ํ๋ ํน์ ์ํฌํ๋ก ํตํฉ์ ๋๋ค.
| ๋๊ตฌ | ๋งํฌ | ์ค๋ช | ๋ผ์ด์ ์ค |
|---|---|---|---|
| Smart Connections | github.com/brianpetro/obsidian-smart-connections | Obsidian์ฉ ์๋ฏธ๋ก ์ ๊ฒ์ ๋ฐ ์ฑํ ํ๋ฌ๊ทธ์ธ | GPL 3.0 |
| Copilot for Obsidian | github.com/logancyang/obsidian-copilot | Obsidian์ฉ ๋ก์ปฌ LLM ์ฑํ ํ๋ฌ๊ทธ์ธ | AGPL 3.0 |
| Text Generator | github.com/nhaouari/obsidian-textgenerator-plugin | Obsidian์ฉ ์ฝํ ์ธ ์์ฑ ํ๋ฌ๊ทธ์ธ | MIT |
| logseq-copilot | github.com/logancyang/logseq-copilot | Logseq์ฉ ๋ก์ปฌ ๋ฐ ํด๋ผ์ฐ๋ LLM ์ฑํ ํ๋ฌ๊ทธ์ธ(Obsidian Copilot๊ณผ ๋์ผ ์์ฑ์) | AGPL 3.0 |
| BMO Chatbot | github.com/longy2k/obsidian-bmo-chatbot | ๋ก์ปฌ LLM์ด ์๋ Obsidian ์ฑ๋ด | MIT |
| Joplin AI | joplinapp.org | ๋ก์ปฌ AI ์ฐ๋์ด ์๋ Joplin ๋ ธํธ | MIT |
| AutoGPT (๋ก์ปฌ) | github.com/Significant-Gravitas/AutoGPT | Ollama ์ง์์ด ์๋ ์์จ ์์ ์์ด์ ํธ | MIT |
| BabyAGI | github.com/yoheinakajima/babyagi | ๊ฒฝ๋ ์์จ ์์ด์ ํธ | MIT |
| MetaGPT | github.com/geekan/MetaGPT | ์ฌ๋ฌ ์์ด์ ํธ๋ฅผ ์ฌ์ฉํ ์ํํธ์จ์ด ํ์ฌ ์๋ฎฌ๋ ์ด์ | MIT |
| Agnai | agnai.chat | ์บ๋ฆญํฐ ์นด๋๊ฐ ์๋ ๋กคํ๋ ์ด ํ๋ฐํธ์๋ | MIT |
| RisuAI | github.com/kwaroran/RisuAI | ๋ชจ๋ฐ์ผ ์นํ์ ๋กคํ๋ ์ด ํ๋ฐํธ์๋ | GPL 3.0 |
์์ธ ๋น๊ต ๊ฐ์ด๋: 2026๋ Obsidian๊ณผ ๋ก์ปฌ LLM
์ค์ ์ฌ์ฉ ์คํ
9๊ฐ ์นดํ ๊ณ ๋ฆฌ ์ ์ฒด๋ฅผ ์ฝ๊ณ ์ถ์ง ์์ ๋ ์๋ฅผ ์ํด ๊ฐ์ฅ ๊ฐ๊น์ด ์คํ์ ์ ํํ๊ณ ๋ณต์ฌํ์ญ์์ค. ๊ฐ ํ์ ์ค์ ๋ชฉํ๋ฅผ ๊ฒ์ฆ๋ ์กฐํฉ ๋ฐ ์ค์ ๋ก ์๋ํ๋ ์ต์ ํ๋์จ์ด์ ์ฐ๊ฒฐํฉ๋๋ค.
| ๋ชฉํ | ์คํ | ์ต์ ํ๋์จ์ด |
|---|---|---|
| ์ผ์์ ์ธ ์ฑํ | LM Studio ๋จ๋ | 16 GB RAM, GPU ๋ถํ์ |
| ํ์์ ์ ๋ฅผ ์ํ ์ต๊ณ ์ ๊ท ํ | Ollama + Open WebUI | 16 GB RAM, GPU ์ ํ์ฌํญ |
| ๋ฌธ์ ์ฑํ | Ollama + AnythingLLM | 16 GB RAM, GPU ์ ํ์ฌํญ |
| ์ฝ๋ฉ | Ollama + Continue.dev | 16 GB RAM + GPU ๊ถ์ฅ |
| ๋กคํ๋ ์ด / ์ฐฝ์ | KoboldCpp + SillyTavern | 16 GB RAM, GPU ๊ถ์ฅ |
| ํ๋ผ์ด๋ฒ์ ์ฐ์ ๊ธฐ์ | Ollama + Open WebUI + PrivateGPT | 32 GB RAM + 12 GB VRAM |
| ๋ชจ๋ฐ์ผ / ์ด๋ ์ค | MLC Chat ๋๋ PocketPal AI | iPhone 13+ / Pixel 7+ |
| Apple Silicon | Ollama (MLX ๋ฐฑ์๋) ๋๋ LM Studio | M2/M3/M4/M5 16 GB+ ํตํฉ ๋ฉ๋ชจ๋ฆฌ |
| ๋ฉํฐ์ ์ ํ | vLLM + Open WebUI | 32 GB+ RAM + ๋ฉํฐ GPU |
์ด ๋๋ ํ ๋ฆฌ๋ฅผ ์ต์ ์ํ๋ก ์ ์งํ๋ ๋ฐฉ๋ฒ
์ด ๋๋ ํ ๋ฆฌ๋ 6๊ฐ์๋ง๋ค ๊ฒํ ๋ฉ๋๋ค โ 2026๋ 6์ ๋ง์ง๋ง ๊ฒํ , ๋ค์ ์ ๋ฐ์ดํธ๋ 2026๋ 11์ ์์ ์ ๋๋ค. 2026๋ 6์ ๊ฒํ ์์๋ ๋ชจ๋ ๋งํฌ๋ฅผ ์ฌํ์ธํ๊ณ ์ฌ๋ฌ ํ๋ก์ ํธ ์ด๋ฆ ๋ฐ ๋ผ์ด์ ์ค๋ฅผ ์์ ํ์ต๋๋ค: Faraday๋ ์ด์ Backyard AI, ์ ์ง ๊ด๋ฆฌ๋๋ Coqui TTS ํฌํฌ๋ Idiap์ด ํธ์คํ ํ๋ฉฐ, Cherry Studio๋ AGPL 3.0์ ๋๋ค. ํฌํจ ๊ธฐ์ค: ํ๋ก์ ํธ๊ฐ ํ๋ฐํ ์ ์ง ๊ด๋ฆฌ๋๊ณ (์ต๊ทผ 90์ผ ๋ด ์ปค๋ฐ), ๊ฒ์ฆ ๊ฐ๋ฅํ ์คํ์์ค ๋ผ์ด์ ์ค ๋๋ ๋ช ํํ ์์ ์ ์ฌ์ฉ ์ ์ธ์ด ์์ผ๋ฉฐ, 2026๋ ๊ธฐ์ค์ผ๋ก ์๋นํ ์ฌ์ฉ์ ๊ธฐ๋ฐ์ ๋ณด์ ํ๊ฑฐ๋ ๊ทธ๋ ์ง ์์ผ๋ฉด ๋น์ด ์์ ๋ ์ด์ด๋ฅผ ์ฑ์๋๋ค. ๋ ๋ฆด๋ฆฌ์ค ์ฃผ๊ธฐ ์ด์ ๋นํ์ฑํ๋ ํ๋ก์ ํธ๋ ์ ๊ฑฐ๋ฉ๋๋ค. ๊ธฐ์ค์ ์ถฉ์กฑํ๋ ์ ๊ท ํ๋ก์ ํธ๋ ๋ค์ ๊ฒํ ์ ์ถ๊ฐ๋ฉ๋๋ค. ํฌํจ์ ์ํ ํ๋ก์ ํธ ์ ์์ PromptQuorum ์ ์ฅ์์ ์ด์ ๋๋ PR์ ์ด์ด์ฃผ์ญ์์ค โ ํ๋ก์ ํธ URL, ๋ผ์ด์ ์ค, ์์ ํ์์ผ๋ก ํ ๋ฌธ์ฅ ์ค๋ช ์ ํฌํจํ์ญ์์ค.
์ถ์ฒ
- ggml-org/llama.cpp GitHub โ ๋ฐํ์ ์ํคํ ์ฒ ๋ฐ ์ง์ ๋ชจ๋ธ์ ๋ํ ๊ธฐ๋ณธ ์ถ์ฒ.
- Ollama Library โ ๊ณต์ ๋ชจ๋ธ ์นดํ๋ก๊ทธ ๋ฐ ๋ฐํ์ ๋ฌธ์.
- LM Studio Documentation โ ์ฃผ์ ๋ฐ์คํฌํฑ GUI์ ๊ธฐ๋ฅ ์ฐธ์กฐ.
- Open WebUI Documentation โ ์ฃผ์ ์ ํํธ์คํ ์น ์ธํฐํ์ด์ค์ ๊ธฐ๋ฅ ์ฐธ์กฐ.
- Hugging Face Hub โ ์์ ๋์ด๋ ๊ฐ ๋ฐํ์์ด ์ฌ์ฉํ๋ ๋ชจ๋ธ ๊ฐ์ค์น๋ฅผ ๋ค์ด๋ก๋ํ๋ ๊ธฐ๋ณธ ์์น.
- awesome-local-llm GitHub list โ ํ๋ก์ ํธ ํฌํจ ํ์ธ์ ์ฌ์ฉ๋ ์ปค๋ฎค๋ํฐ ์ ์ง ์ธ๋ฒคํ ๋ฆฌ.
FAQ
๋ก์ปฌ LLM ๋ฐํ์๊ณผ ๋ฐ์คํฌํฑ ์ฑ์ ์ฐจ์ด๋ ๋ฌด์์ ๋๊น?
๋ฐํ์(Ollama, llama.cpp, vLLM)์ ๋ชจ๋ธ ๊ฐ์ค์น๋ฅผ ๋ก๋ํ๊ณ API(๋ณดํต OpenAI ํธํ)๋ฅผ ์ ๊ณตํ๋ ์์ง์ ๋๋ค. ๋ฐ์คํฌํฑ ์ฑ(LM Studio, Jan, GPT4All)์ ๋ฐํ์์ ๋ฐฑ๊ทธ๋ผ์ด๋์์ ํธ์ถํ๋ ์ฑํ ์ธํฐํ์ด์ค์ ๋๋ค. ์ผ๋ถ ์ฑ์ ์์ฒด ๋ฐํ์์ ํฌํจํฉ๋๋ค(LM Studio๋ llama.cpp๋ฅผ ๋ด์ฅ). ๋ค๋ฅธ ์ฑ์ ๋ณ๋ ๋ฐํ์ ์ค์น๊ฐ ํ์ํฉ๋๋ค(Open WebUI๋ Ollama๋ฅผ ํธ์ถ). ๋ฐํ์์ ๊ฐ๋ฅํ ๊ฒ์ ๊ฒฐ์ ํ๊ณ , ์ฑ์ ํธ๋ฆฌํ ๊ฒ์ ๊ฒฐ์ ํฉ๋๋ค.
์ด ๋ชฉ๋ก์์ ์ฌ๋ฌ ๋๊ตฌ๋ฅผ ๋์์ ์ฌ์ฉํ ์ ์์ต๋๊น?
๋ค โ ๋๋ถ๋ถ์ ์คํ์ 2-4๊ฐ์ ๋๊ตฌ๋ฅผ ๊ฒฐํฉํฉ๋๋ค. ์ผ๋ฐ์ ์ธ ๊ตฌ์ฑ: Ollama๋ฅผ ๋ฐํ์์ผ๋ก, Open WebUI๋ฅผ ์ฑํ ์ฉ์ผ๋ก, AnythingLLM์ ๋ฌธ์ ์ฑํ ์ฉ์ผ๋ก, Continue.dev๋ฅผ ์ฝ๋ฉ์ฉ์ผ๋ก โ 4๊ฐ ๋ชจ๋ ๋จ์ผ ๋จธ์ ์ ๋์ผํ Ollama ์ธ์คํด์ค์ ํจ๊ป ์๋ํฉ๋๋ค. ์์ "์ค์ ์ฌ์ฉ ์คํ" ํ์๋ ์ถฉ๋ ์์ด ์๋ํ๋ ๋ ์ํผ๊ฐ ๋์ด๋์ด ์์ต๋๋ค.
ํ ๋ ๋ฉํธ๋ฆฌ ์์ด ์์ ์คํ๋ผ์ธ์ผ๋ก ์๋ํ๋ ๋๊ตฌ๋ ๋ฌด์์ ๋๊น?
Ollama, llama.cpp, vLLM, Jan, GPT4All, Open WebUI, AnythingLLM, PrivateGPT, Continue.dev, Aider, KoboldCpp, Llamafile, MLX-LM ๋ฐ ์ด ๋๋ ํ ๋ฆฌ์ ๋๋ถ๋ถ AGPL/MIT ๋ผ์ด์ ์ค ์ฑ์ ๋ชจ๋ธ์ด ๋ค์ด๋ก๋๋๋ฉด ์์ ์คํ๋ผ์ธ์ผ๋ก ์๋ํฉ๋๋ค. LM Studio์ ์ผ๋ถ ๋น๊ณต๊ฐ ์์ค ๋๊ตฌ๋ ์ค์ ์์ ๋นํ์ฑํํ ์ ์๋ ์ ํ์ ๋ถ์ ๊ธฐ๋ฅ์ด ์์ต๋๋ค โ ์ค์น ํ ํ ๋ฒ ํจํท ์บก์ฒ๋ก ํ์ธํ์ญ์์ค. ์น ์ธํฐํ์ด์ค(Open WebUI, LibreChat)๋ ๋ก์ปฌ ๋ฐฑ์๋๋ฅผ ์ฌ์ฉํ๋๋ก ๊ตฌ์ฑ๋ ๊ฒฝ์ฐ์๋ง ๋ก์ปฌ์ ๋๋ค.
์ด ๋๊ตฌ ์ค ์ผ๋ถ๋ ์์ ์ ๋ผ์ด์ ์ค(์์ ์ ์ฌ์ฉ์ ๋ฌด๋ฃ๊ฐ ์๋)๊ฐ ์์ต๋๊น?
์ผ๋ถ ์์ต๋๋ค: LM Studio, Msty, Backyard AI, Layla, Cursor๋ ๋น๊ณต๊ฐ ์์ค โ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉํ๊ธฐ ๋ฌด๋ฃ์ด์ง๋ง ์ฌ๋ฐฐํฌํ ์ ์์ผ๋ฉฐ ์์ ์ ์ฝ๊ด์ ๋ค๋ฆ ๋๋ค. Private LLM์ ์ ๋ฃ์ ๋๋ค. AGPL ๋ผ์ด์ ์ค ๋๊ตฌ(Jan, KoboldCpp, text-generation-webui, SillyTavern, Khoj, Open Interpreter, Copilot for Obsidian)๋ ์์ ์ ์ฌ์ฉ์ ํฌํจํ ๋ชจ๋ ์ฌ์ฉ์ ๋ฌด๋ฃ์ด์ง๋ง AGPL ์ฝ๊ด์ ์์ ํ์ฌ ๊ณต๊ฐ์ ์ผ๋ก ํธ์คํ ํ ๊ฒฝ์ฐ ์์ค ์ฝ๋ ๊ณต๊ฐ๋ฅผ ์๊ตฌํฉ๋๋ค. Apache 2.0 ๋ฐ MIT ํ๋ก์ ํธ(๋๋ถ๋ถ)๋ ๋ผ์ด์ ์ค ํ ์คํธ ์ด์์ ๊ท์ ์ ํ ์์ด ์์ ์ ๋งฅ๋ฝ์ ํฌํจํ ๋ชจ๋ ๋งฅ๋ฝ์์ ์ฌ์ฉ ๊ฐ๋ฅํฉ๋๋ค.
๋ค์ดํฐ๋ธ๋ก Apple Silicon(M ์๋ฆฌ์ฆ ์นฉ)์ ์ง์ํ๋ ๋๊ตฌ๋ ๋ฌด์์ ๋๊น?
Ollama, llama.cpp, MLX-LM, LM Studio, Jan, Enchanted, GPT4All, MLC Chat, AnythingLLM ๋ฐ ๋๋ถ๋ถ์ Electron/Tauri ์ฑ์ Apple Silicon์์ ๋ค์ดํฐ๋ธ๋ก ์๋ํ๋ฉฐ Metal ๋ฐฑ์๋๋ฅผ ์ฌ์ฉํฉ๋๋ค. MLX-LM์ Apple ์ ์ฉ์ด๋ฉฐ M ์๋ฆฌ์ฆ ์นฉ์ ๋ํ ๋ชจ๋ธ์ ๊ฐ์ฅ ๋น ๋ฆ ๋๋ค. vLLM, TensorRT-LLM, ExLlamaV2๋ NVIDIA ์ค์ฌ์ด๋ฉฐ Apple Silicon์์ ์๋ํ์ง ์๊ฑฐ๋ ์ ๋๋ก ์๋ํ์ง ์์ต๋๋ค โ Apple ์ฌ์ฉ์์๊ฒ๋ Metal ๋ฐฑ์๋๊ฐ ์๋ Ollama๊ฐ ๊ธฐ๋ณธ ์ ํ์ ๋๋ค.
์ด ๋๊ตฌ๋ค์ ๋ชจ๋ GGUF ๋ชจ๋ธ ํ์์ ์ง์ํฉ๋๊น?
GGUF๋ llama.cpp์ ์ด๋ฅผ ๊ฐ์ธ๋ ๋ชจ๋ ๋๊ตฌ(Ollama, LM Studio, Jan, GPT4All, KoboldCpp, Llamafile)์ ๋ค์ดํฐ๋ธ ํ์์ ๋๋ค. vLLM๊ณผ TensorRT-LLM์ ๋ ๋์ ์ฑ๋ฅ์ ์ํด ์์ฒด ์ต์ ํ ํ์(๋ณดํต AWQ ๋๋ FP16)์ ์ฌ์ฉํฉ๋๋ค. ExLlamaV2๋ EXL2 ์์ํ๋ฅผ ์ฌ์ฉํฉ๋๋ค. MLX-LM์ MLX๋ก ๋ณํ๋ ๊ฐ์ค์น๋ฅผ ์ฌ์ฉํฉ๋๋ค. ๋์ด๋ ๋๋ถ๋ถ์ ๋๊ตฌ๋ GGUF๋ฅผ ํ์ฉํฉ๋๋ค. ์ผ๋ถ(vLLM, TensorRT-LLM, ExLlamaV2, MLX-LM)๋ ์๋ณธ Hugging Face ๊ฐ์ค์น์์ ์ผํ์ฑ ๋ณํ ๋จ๊ณ๊ฐ ํ์ํฉ๋๋ค.
์ฝ๋ฉ ๊ฒฝํ์ด ์๋ ์ฌ์ฉ์์๊ฒ ๊ฐ์ฅ ์ข์ ๋๊ตฌ๋ ๋ฌด์์ ๋๊น?
GPT4All์ ๊ฐ์ฅ ๊ฐ๋จํ ์ค์น(์ํด๋ฆญ, 8 GB RAM์ผ๋ก ์๋)๋ฅผ ์ ๊ณตํฉ๋๋ค. LM Studio๋ ํฐ๋ฏธ๋ ์์ด ๊ฐ์ฅ ํ๋ถํ ๊ธฐ๋ฅ์ ์ ๊ณตํฉ๋๋ค. Jan์ ์ฝ๋ฉ ์์ด ๊ฐ์ฅ ํ๋ผ์ด๋ฒ์ ์ค์ฌ์ ์ ํ์ ๋๋ค. ๋ช ๋ น์ค ์์ ์์ด ๋ฌธ์ ์ฑํ ์ ์ํ๋ค๋ฉด AnythingLLM์ด ๊ฐ์ฅ ์ฝ์ต๋๋ค. ๋ค ๊ฐ์ง ๋ชจ๋ ์์ ๋ฐ์คํฌํฑ ์ฑ(GUI) ์นดํ ๊ณ ๋ฆฌ์ ๋์ด๋์ด ์์ต๋๋ค.
์ด ๋๊ตฌ๋ค์ ์๋ฒ์์ ์คํํ๊ณ ์๊ฒฉ์ผ๋ก ์ ๊ทผํ ์ ์์ต๋๊น?
์๋ฒ ๊ธฐ๋ฅ์ด ์๋ ๋๋ถ๋ถ์ ๋๊ตฌ(Ollama, vLLM, LocalAI, Open WebUI, LibreChat, PrivateGPT, AnythingLLM)๋ HTTP API๋ฅผ ๋ ธ์ถํ๊ณ ์ค์ ์์ ๊ตฌ์ฑ ๊ฐ๋ฅํ ๋คํธ์ํฌ ์ธํฐํ์ด์ค์ ๋ฐ์ธ๋ฉ๋ฉ๋๋ค. ํ์ค ํจํด: ํ ์๋ฒ๋ VPS์์ Ollama๋ฅผ ์คํํ๊ณ , ์๋ฒ IP๋ฅผ ๊ฐ๋ฆฌํค๋ ๋ฉํฑ์ด๋ ํฐ์์ ์ธํฐํ์ด์ค๋ฅผ ์คํํฉ๋๋ค. API๋ฅผ ๋ค๋ฅธ ์น ์๋น์ค์ฒ๋ผ ์ทจ๊ธํ์ญ์์ค โ ์ญ๋ฐฉํฅ ํ๋ก์ ๋ค์ localhost์ ๋ฐ์ธ๋ฉํ๊ฑฐ๋ ์ ์ ํ ์ธ์ฆ์ด ์๋ ์ฌ์ค ๋คํธ์ํฌ์ ๋ฐ์ธ๋ฉํฉ๋๋ค. Open WebUI๋ ๋ฉํฐ์ ์ ์ง์์ ๊ธฐ๋ณธ์ผ๋ก ํฌํจํฉ๋๋ค.
๋ฉํฐ์ ์ / ํ ์ค์ ์ ์ง์ํ๋ ๋๊ตฌ๋ ๋ฌด์์ ๋๊น?
Open WebUI, LibreChat, h2oGPT, AnythingLLM(๊ด๋ฆฌ์ ๊ธฐ๋ฅ ํ์ฑํ ์), Dify๋ ์ญํ ๊ธฐ๋ฐ ์ ๊ทผ ์ ์ด ๋ฐ ์ฌ์ฉ์๋ณ ๋ํ ๊ธฐ๋ก์ด ์๋ ๋ฉํฐ์ ์ ์ฌ์ฉ์ ์ํด ์ค๊ณ๋์์ต๋๋ค. vLLM์ ๋์ ์ถ๋ก ์ด ์ค์ํ ๋ ํ๋ถ์ ์ฌ๋ฐ๋ฅธ ์๋น ๋ ์ด์ด์ ๋๋ค โ ~3 ์ด์์ ๋์์ฑ์์ Ollama๋ก๋ ๋ฌ์ฑํ ์ ์๋ ์ฑ๋ฅ์ ์ํด ์ฌ๋ฌ ์ฌ์ฉ์์ ์์ฒญ์ ๋ฐฐ์น ์ฒ๋ฆฌํฉ๋๋ค.
์ด ๋๋ ํ ๋ฆฌ๋ ์ผ๋ง๋ ์์ฃผ ์ ๋ฐ์ดํธ๋ฉ๋๊น?
6๊ฐ์๋ง๋ค โ 2026๋ 6์ ๋ง์ง๋ง ๊ฒํ , ๋ค์ ์์ ์ ๋ฐ์ดํธ๋ 2026๋ 11์์ ๋๋ค. ์ค๊ฐ ๋ณ๊ฒฝ์ฌํญ(ํ๋ก์ ํธ๊ฐ ๋นํ์ฑํ, ์ ๋๊ตฌ๊ฐ ์๋นํ ์ ์ ์จ์ ํ๋, ๋ผ์ด์ ์ค ๋ณ๊ฒฝ)์ ๊ธฐ์กด ํญ๋ชฉ์ ํจ์น๋ก ์ ์ฉ๋ฉ๋๋ค. ์์ ํ ์๋ก์ด ์นดํ ๊ณ ๋ฆฌ๋ ๋ ์ด์ด๋ ๊ตฌ์กฐ๋ฅผ ์์ ์ ์ผ๋ก ์ ์งํ๊ธฐ ์ํด ๊ฒํ ๊น์ง ๊ธฐ๋ค๋ฆฝ๋๋ค. ์์ "์ถ์ฒ" ์น์ ์๋ ๊ฒํ ์ฌ์ด์ ์ํ๊ณ ๋ํฅ์ ๋ชจ๋ํฐ๋งํ๋ ๋ฐ ์ฌ์ฉ๋๋ ์ปค๋ฎค๋ํฐ ์ธ๋ฑ์ค๊ฐ ๋์ด๋์ด ์์ต๋๋ค.