Skip to main content
PromptQuorumPromptQuorum
ํ™ˆ/๊ณ ๊ธ‰ ๋กœ์ปฌ LLM/๋ฐฉํ™”๋ฒฝ ๋’ค ๋กœ์ปฌ AI: 2026 ์˜คํ”„๋ผ์ธ ๋ฐฐํฌ ๊ฐ€์ด๋“œ
Overview & Reference

๋ฐฉํ™”๋ฒฝ ๋’ค ๋กœ์ปฌ AI: 2026 ์˜คํ”„๋ผ์ธ ๋ฐฐํฌ ๊ฐ€์ด๋“œ

ยท12๋ถ„ ๋ถ„๋Ÿ‰ยทHans Kuepper ์ € ยท PromptQuorum ์ฐฝ๋ฆฝ์ž, ๋ฉ€ํ‹ฐ ๋ชจ๋ธ AI ๋””์ŠคํŒจ์น˜ ๋„๊ตฌ ยท PromptQuorum

์ธํ„ฐ๋„ท์ด ์—ฐ๊ฒฐ๋œ ๊ธฐ๊ธฐ์—์„œ Ollama, Q4_K_M ๋ชจ๋ธ ํŒŒ์ผ, ํ† ํฌ๋‚˜์ด์ € ์„ค์ • ํŒŒ์ผ์„ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค. USB, SSD ๋˜๋Š” ๋‚ด๋ถ€ ๋„คํŠธ์›Œํฌ ๊ณต์œ ๋ฅผ ํ†ตํ•ด ์˜คํ”„๋ผ์ธ ํ™˜๊ฒฝ์œผ๋กœ ์ „์†กํ•˜์‹ญ์‹œ์˜ค. ์ดˆ๊ธฐ ๋‹ค์šด๋กœ๋“œ ์ดํ›„์—๋Š” ์ธํ„ฐ๋„ท ์—ฐ๊ฒฐ์ด ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

๊ธฐ์—… ๋ฐฉํ™”๋ฒฝ ๋’ค ๋˜๋Š” ์—์–ด๊ฐญ(air-gapped) ํ™˜๊ฒฝ์—์„œ ๋กœ์ปฌ AI๋ฅผ ์‹คํ–‰ํ•˜๋ ค๋ฉด ์ธํ„ฐ๋„ท ์ ‘์†์ด ๋Š๊ธฐ๊ธฐ ์ „์— ๋ชจ๋“  ์˜์กด์„ฑ์„ ๋‹ค์šด๋กœ๋“œํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ํ† ํฌ๋‚˜์ด์ € ์„ค์ • ํŒŒ์ผ, ์ฑ„ํŒ… ํ…œํ”Œ๋ฆฟ, ์–‘์žํ™”๋œ ๋ชจ๋ธ ์กฐ๊ฐ ํ•˜๋‚˜๋งŒ ๋ˆ„๋ฝ๋˜์–ด๋„ ์•„๋ฌด๋Ÿฐ ๊ฒฝ๊ณ  ์—†์ด ์‹คํ–‰์ด ์ค‘๋‹จ๋ฉ๋‹ˆ๋‹ค. ์ด ๊ฐ€์ด๋“œ๋Š” ๋ฐฐํฌ ์ „ ์ „์ฒด ์ฒดํฌ๋ฆฌ์ŠคํŠธ, Ollama์™€ llama.cpp๋ฅผ ์œ„ํ•œ ๋‹จ๊ณ„๋ณ„ ์˜คํ”„๋ผ์ธ ์›Œํฌํ”Œ๋กœ, ๋ฐ์ดํ„ฐ ๋ ˆ์ง€๋˜์‹œ ๊ทœ์ •์ด ์ ์šฉ๋˜๋Š” ์กฐ์ง์„ ์œ„ํ•œ ํ•˜๋“œ์›จ์–ด ๊ถŒ์žฅ ์‚ฌํ•ญ์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์Šฌ๋ผ์ด๋“œ ๋ฑ: ๋ฐฉํ™”๋ฒฝ ๋’ค ๋กœ์ปฌ AI: 2026 ์˜คํ”„๋ผ์ธ ๋ฐฐํฌ ๊ฐ€์ด๋“œ

์ด ๊ธฐ์‚ฌ์˜ ๋Œ€ํ™”ํ˜• ์Šฌ๋ผ์ด๋“œ ๋ฑ์ž…๋‹ˆ๋‹ค.

์•„๋ž˜ ์Šฌ๋ผ์ด๋“œ๋ฅผ ํƒ์ƒ‰ํ•˜๊ฑฐ๋‚˜ ์˜คํ”„๋ผ์ธ ์ฐธ์กฐ์šฉ์œผ๋กœ PDF๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค. ์ฐธ์กฐ ์นด๋“œ ๋‹ค์šด๋กœ๋“œ(PDF)

ํ•ต์‹ฌ ์š”์ 

  • ์—ฐ๊ฒฐ๋œ ๊ธฐ๊ธฐ์—์„œ ๋ชจ๋‘ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค: Ollama ๋ฐ”์ด๋„ˆ๋ฆฌ, ๋ชจ๋ธ GGUF, ํ† ํฌ๋‚˜์ด์ € ์„ค์ •, RAG ์˜์กด์„ฑ ํŒŒ์ผ
  • USB SSD, ๋‚ด๋ถ€ ๋„คํŠธ์›Œํฌ ๊ณต์œ , ๋˜๋Š” ์—์–ด๊ฐญ ๋…ธํŠธ๋ถ์œผ๋กœ ์ „์†กํ•˜์‹ญ์‹œ์˜ค. ํด๋ผ์šฐ๋“œ ๋™๊ธฐํ™”์— ์˜์กดํ•˜์ง€ ๋งˆ์‹ญ์‹œ์˜ค
  • OLLAMA_MODELS ํ™˜๊ฒฝ ๋ณ€์ˆ˜๋ฅผ ์˜คํ”„๋ผ์ธ ๋ชจ๋ธ ๋””๋ ‰ํ„ฐ๋ฆฌ๋กœ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค
  • Qwen3 14B Q4_K_M(9.5 GB)์ด ์˜คํ”„๋ผ์ธ ๊ธฐ๋ณธ๊ฐ’์œผ๋กœ ๊ถŒ์žฅ๋ฉ๋‹ˆ๋‹ค. 16 GB ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ์—์„œ ์‹คํ–‰ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค
  • NAS ์šฉ๋Ÿ‰ ๊ณ„ํš: 7B ๋ชจ๋ธ๋‹น 20 GB, 14B ๋ชจ๋ธ๋‹น 50 GB, 32B ๋ชจ๋ธ๋‹น 100 GB(Q4_K_M ๊ธฐ์ค€)
  • ๋ฐ์ดํ„ฐ ์ปดํ”Œ๋ผ์ด์–ธ์Šค: ๋กœ์ปฌ ์ถ”๋ก ์€ ๋ชจ๋ธ ์ถœ์ฒ˜์™€ ๋ฌด๊ด€ํ•˜๊ฒŒ ๋ฐ์ดํ„ฐ ๋ ˆ์ง€๋˜์‹œ ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ถฉ์กฑํ•ฉ๋‹ˆ๋‹ค

์‚ฌ์ „ ์ฒดํฌ๋ฆฌ์ŠคํŠธ โ€” ์—ฐ๊ฒฐ ํ•ด์ œ ์ „ ๋‹ค์šด๋กœ๋“œ

์—์–ด๊ฐญ ํ™˜๊ฒฝ์œผ๋กœ ์ „ํ™˜ํ•˜๊ธฐ ์ „์— ์—ฐ๊ฒฐ๋œ ๊ธฐ๊ธฐ์—์„œ ๊ฐ ํ•ญ๋ชฉ์„ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

  1. 1
    Ollama ๋ฐ”์ด๋„ˆ๋ฆฌ โ€” ์šด์˜ ์ฒด์ œ(Linux x86_64, macOS arm64, Windows)์— ๋งž๋Š” ๋ฒ„์ „์„ ollama.com์—์„œ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค. โ‰ฅ0.3.0 ๋ฒ„์ „์„ ๊ถŒ์žฅํ•ฉ๋‹ˆ๋‹ค.
  2. 2
    ๋ชจ๋ธ GGUF ํŒŒ์ผ โ€” ์—ฐ๊ฒฐ๋œ ๊ธฐ๊ธฐ์—์„œ ollama pull qwen2.5:14b-instruct-q4_K_M์„ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. ๋ชจ๋ธ์€ ~/.ollama/models/์— ์บ์‹œ๋ฉ๋‹ˆ๋‹ค.
  3. 3
    ํ† ํฌ๋‚˜์ด์ € + ์ฑ„ํŒ… ํ…œํ”Œ๋ฆฟ โ€” Ollama ์‚ฌ์šฉ ์‹œ ๋ชจ๋ธ ๋งค๋‹ˆํŽ˜์ŠคํŠธ์™€ ํ•จ๊ป˜ ํฌํ•จ๋˜๋ฏ€๋กœ ๋ณ„๋„ ๋‹ค์šด๋กœ๋“œ๊ฐ€ ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.
  4. 4
    llama.cpp ๋ฐ”์ด๋„ˆ๋ฆฌ (llama.cpp ์‚ฌ์šฉ ์‹œ) โ€” github.com/ggerganov/llama.cpp/releases์—์„œ ์‚ฌ์ „ ์ปดํŒŒ์ผ๋œ ๋ฆด๋ฆฌ์Šค๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค.
  5. 5
    ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ (์˜คํ”„๋ผ์ธ RAG์šฉ) โ€” ollama pull nomic-embed-text ๋˜๋Š” mxbai-embed-large
  6. 6
    ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๋ฐ”์ด๋„ˆ๋ฆฌ (์˜คํ”„๋ผ์ธ RAG์šฉ) โ€” Chroma standalone, Qdrant ๋ฐ”์ด๋„ˆ๋ฆฌ ๋˜๋Š” SQLite+sqlite-vss(Python ์„ค์น˜ ๋ถˆํ•„์š”)
  7. 7
    Python ํœ  ํŒŒ์ผ (Python ๋„๊ตฌ ์‚ฌ์šฉ ์‹œ) โ€” pip download --no-deps๋กœ .whl ํŒŒ์ผ์„ ๋‹ค์šด๋กœ๋“œํ•˜์—ฌ ์ „์†กํ•˜์‹ญ์‹œ์˜ค.
  8. 8
    ๊ฒ€์ฆ ํ•ด์‹œ โ€” ๊ฐ GGUF ํŒŒ์ผ์— sha256sum์„ ์‹คํ–‰ํ•˜์—ฌ ์ „์†ก ์ „ ์†์ƒ ์—ฌ๋ถ€๋ฅผ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

์—ฐ๊ฒฐ๋œ ๊ธฐ๊ธฐ์—์„œ ์‹คํ–‰ํ•  ๋‹ค์šด๋กœ๋“œ ๋ช…๋ น์–ด

์ „์†ก ์ „์— ์ธํ„ฐ๋„ท์ด ์—ฐ๊ฒฐ๋œ ๊ธฐ๊ธฐ์—์„œ ๋‹ค์Œ ๋ช…๋ น์–ด๋ฅผ ๋ชจ๋‘ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. ๋ชจ๋ธ ํƒœ๊ทธ๋Š” ํ•„์š”์— ๋”ฐ๋ผ ๋ณ€๊ฒฝํ•˜์‹ญ์‹œ์˜ค.

  • ollama pull qwen2.5:14b-instruct-q4_K_M โ€” 9.5 GB, ๊ถŒ์žฅ ๊ธฐ๋ณธ๊ฐ’
  • ollama pull qwen2.5:7b-instruct-q4_K_M โ€” 5.5 GB, VRAM์ด ์ ์€ ๊ธฐ๊ธฐ์šฉ
  • ollama pull nomic-embed-text โ€” 274 MB, ์˜คํ”„๋ผ์ธ RAG ์ž„๋ฒ ๋”ฉ์šฉ
  • ollama pull deepseek-r1:7b โ€” 5.5 GB, ์ˆ˜ํ•™ยท์ถ”๋ก  ์ค‘์‹ฌ ์‚ฌ์šฉ ์‚ฌ๋ก€์šฉ
  • ๋ชจ๋ธ ํŒŒ์ผ ์œ„์น˜: Linux/macOS๋Š” ~/.ollama/models/, Windows๋Š” %USERPROFILE%\.ollama\models
  • llama.cpp ์‚ฌ์šฉ ์‹œ: HuggingFace์—์„œ GGUF๋ฅผ ์ง์ ‘ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  ์ „์†ก ์ „ SHA256์„ ๊ฒ€์ฆํ•˜์‹ญ์‹œ์˜ค

Ollama ์—์–ด๊ฐญ ์›Œํฌํ”Œ๋กœ

ํŒŒ์ผ์„ ์˜คํ”„๋ผ์ธ ๊ธฐ๊ธฐ๋กœ ์ „์†กํ•œ ํ›„ ๋‹ค์Œ ์ ˆ์ฐจ๋ฅผ ๋”ฐ๋ฅด์‹ญ์‹œ์˜ค.

  1. 1
    ์—ฐ๊ฒฐ๋œ ๊ธฐ๊ธฐ์˜ ~/.ollama/ ๋””๋ ‰ํ„ฐ๋ฆฌ ์ „์ฒด๋ฅผ ์˜คํ”„๋ผ์ธ ํ˜ธ์ŠคํŠธ์˜ ๋™์ผ ๊ฒฝ๋กœ๋กœ ๋ณต์‚ฌํ•˜์‹ญ์‹œ์˜ค.
  2. 2
    Ollama ๋ฐ”์ด๋„ˆ๋ฆฌ๋ฅผ ์„ค์น˜ํ•˜์‹ญ์‹œ์˜ค: chmod +x ollama && sudo mv ollama /usr/local/bin/
  3. 3
    ๋ชจ๋ธ ๋””๋ ‰ํ„ฐ๋ฆฌ๋ฅผ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค: export OLLAMA_MODELS=/์˜คํ”„๋ผ์ธ/ollama/models ๊ฒฝ๋กœ
  4. 4
    ์„œ๋ฒ„๋ฅผ ์‹œ์ž‘ํ•˜์‹ญ์‹œ์˜ค: ollama serve โ€” ๋กœ๊ทธ์—์„œ ๋„คํŠธ์›Œํฌ ํ˜ธ์ถœ ์—†์ด ์‹œ์ž‘๋˜๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.
  5. 5
    ์˜คํ”„๋ผ์ธ ํ…Œ์ŠคํŠธ: ollama run qwen2.5:14b โ€” ์™ธ๋ถ€ URL ์ ‘์† ์—†์ด ์ฆ‰์‹œ ์‘๋‹ตํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.
  6. 6
    LAN ์ ‘์†์„ ์œ„ํ•œ ์ „์ฒด ์ธํ„ฐํŽ˜์ด์Šค ๋ฐ”์ธ๋”ฉ: OLLAMA_HOST=0.0.0.0:11434 ollama serve

llama.cpp ์—์–ด๊ฐญ ์›Œํฌํ”Œ๋กœ

llama.cpp๋Š” ๋ฐ”์ด๋„ˆ๋ฆฌ์™€ GGUF ํŒŒ์ผ๋งŒ ์žˆ์œผ๋ฉด ์™„์ „ํžˆ ๋…๋ฆฝ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. ๋Ÿฐํƒ€์ž„ ์˜์กด์„ฑ์ด ์—†์Šต๋‹ˆ๋‹ค.

  • ์‚ฌ์ „ ์ปดํŒŒ์ผ๋œ ๋ฐ”์ด๋„ˆ๋ฆฌ์™€ GGUF ํŒŒ์ผ์„ ์˜คํ”„๋ผ์ธ ๊ธฐ๊ธฐ๋กœ ์ „์†กํ•˜์‹ญ์‹œ์˜ค.
  • ์‹คํ–‰: ./llama-server -m ./qwen2.5-14b-instruct-q4_K_M.gguf --port 8080
  • --no-mmap ํ”Œ๋ž˜๊ทธ๋Š” ๋„คํŠธ์›Œํฌ ๊ณต์œ ์—์„œ ์‹คํ–‰ ์‹œ ๋ฉ”๋ชจ๋ฆฌ ๋งต I/O๋ฅผ ๋น„ํ™œ์„ฑํ™”ํ•ฉ๋‹ˆ๋‹ค.
  • NVIDIA GPU์—์„œ ๋ ˆ์ด์–ด ์˜คํ”„๋กœ๋“œ: --n-gpu-layers 35, Apple Silicon์—์„œ ์ „์ฒด ์˜คํ”„๋กœ๋“œ: --n-gpu-layers -1
  • OpenAI ํ˜ธํ™˜ API๋Š” http://localhost:8080/v1์—์„œ ์ œ๊ณต๋ฉ๋‹ˆ๋‹ค. ๋ชจ๋“  OpenAI SDK์™€ ํ˜ธํ™˜๋ฉ๋‹ˆ๋‹ค.

์˜คํ”„๋ผ์ธ ๋ชจ๋ธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋ฅผ ์œ„ํ•œ NAS ์šฉ๋Ÿ‰ ๊ณ„ํš

์†Œ๊ทœ๋ชจ ํŒ€์˜ ๋ชจ๋ธ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ๋‹ค์–‘ํ•œ ํฌ๊ธฐ์˜ ๋ชจ๋ธ 3~6๊ฐœ๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ๊ตฌ๋งค ์ „์— ์Šคํ† ๋ฆฌ์ง€๋ฅผ ๊ณ„ํšํ•˜์‹ญ์‹œ์˜ค.

  • ๋ชจ๋ธ ์Šคํ† ๋ฆฌ์ง€ ๊ถŒ์žฅ NAS: Synology DS923+, 4 TB ๋“œ๋ผ์ด๋ธŒ 4๊ฐœ RAID 5 ๊ตฌ์„ฑ(์‚ฌ์šฉ ๊ฐ€๋Šฅ ์šฉ๋Ÿ‰ ์•ฝ 12 TB)
  • ๋ชจ๋ธ 2~3๊ฐœ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์˜ ์ตœ์†Ÿ๊ฐ’: 2 TB SSD(๋‹จ์ผ ๊ธฐ๊ธฐ ๋ฐฐํฌ๋Š” ํœด๋Œ€์šฉ ๋“œ๋ผ์ด๋ธŒ๋กœ ์ถฉ๋ถ„)
  • NFS๋ฅผ ํ†ตํ•ด NAS๋ฅผ ์ถ”๋ก  ์„œ๋ฒ„์— ๋งˆ์šดํŠธํ•˜๊ณ  OLLAMA_MODELS๋ฅผ NFS ๊ฒฝ๋กœ๋กœ ์„ค์ •ํ•˜์‹ญ์‹œ์˜ค
๋ชจ๋ธQ4_K_M ํฌ๊ธฐQ8_0 ํฌ๊ธฐํ•„์š” VRAM
Qwen3 7B5.5 GB8.5 GB8 GB
Qwen3 14B9.5 GB15 GB12 GB
Qwen3 32B20.5 GB34 GB24 GB
Qwen3 72B46 GB75 GB48 GB
nomic-embed-text0.27 GB0.5 GB1 GB

๋ฐ์ดํ„ฐ ๋ ˆ์ง€๋˜์‹œ ์ปดํ”Œ๋ผ์ด์–ธ์Šค

๋งŽ์€ ์กฐ์ง์ด ๋ฏผ๊ฐํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ์ปฌ์—์„œ ์ฒ˜๋ฆฌยท๋ณด๊ด€ํ•˜๋„๋ก ์š”๊ตฌํ•˜๋Š” ๊ทœ์ •์„ ์ค€์ˆ˜ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ ์ถ”๋ก ์€ ์ด๋Ÿฌํ•œ ์˜๋ฌด ์ดํ–‰์„ ํฌ๊ฒŒ ๋‹จ์ˆœํ™”ํ•ฉ๋‹ˆ๋‹ค.

  • ๋ฐ์ดํ„ฐ ๋ ˆ์ง€๋˜์‹œ: ๋กœ์ปฌ ์ถ”๋ก ์€ ๋ชจ๋ธ ์ถœ์ฒ˜์™€ ๋ฌด๊ด€ํ•˜๊ฒŒ ๋ฐ์ดํ„ฐ๊ฐ€ ์ž์ฒด ํ•˜๋“œ์›จ์–ด ๋ฐ–์œผ๋กœ ๋‚˜๊ฐ€์ง€ ์•Š์Œ์„ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์—…์ข…๋ณ„ ๋ฐ์ดํ„ฐ ๋ ˆ์ง€๋˜์‹œ ์š”๊ตฌ ์‚ฌํ•ญ์„ ์ถฉ์กฑํ•ฉ๋‹ˆ๋‹ค.
  • ๋ชจ๋ธ ์ถœ์ฒ˜: ๋ชจ๋ธ ๊ณต๊ธ‰์—…์ฒด์™€ ๋ฒ„์ „์„ ๋ฌธ์„œํ™”ํ•˜๋ฉด ๋‚ด๋ถ€ ์ปดํ”Œ๋ผ์ด์–ธ์Šค ๊ฐ์‚ฌ๊ฐ€ ์šฉ์ดํ•ด์ง‘๋‹ˆ๋‹ค. Qwen3(Alibaba), DeepSeek(DeepSeek AI)์€ ๊ด€๋ฆฌ ์—ฐ์†์„ฑ์ด ๋ฌธ์„œํ™”๋œ ๋ชจ๋ธ์˜ ์˜ˆ์ž…๋‹ˆ๋‹ค.
  • ๊ณต๊ฐœ ์„œ๋น„์Šคํ˜• AI: ๋ฐฐํฌ๊ฐ€ ์™ธ๋ถ€ ์‚ฌ์šฉ์ž์—๊ฒŒ ์ ‘๊ทผ ๊ฐ€๋Šฅํ•œ ๊ฒฝ์šฐ(์ˆœ์ˆ˜ ๋‚ด๋ถ€์šฉ์ด ์•„๋‹Œ ๊ฒฝ์šฐ), ํ•ด๋‹น ๊ด€ํ• ๊ถŒ์—์„œ ์ ์šฉ๋˜๋Š” ํ†ต์ง€ ์˜๋ฌด๋ฅผ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค. ์ง์›๋งŒ ์‚ฌ์šฉํ•˜๋Š” ๋‚ด๋ถ€ยท์˜คํ”„๋ผ์ธ ๋ฐฐํฌ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ์ ์šฉ ๋ฒ”์œ„ ๋ฐ–์ž…๋‹ˆ๋‹ค.
  • ๋„คํŠธ์›Œํฌ ๊ฒฉ๋ฆฌ ๊ฒ€์ฆ: iptables ๋˜๋Š” ๋ฐฉํ™”๋ฒฝ ๊ทœ์น™์„ ์‚ฌ์šฉํ•˜์—ฌ ์ถ”๋ก  ์„œ๋ฒ„์—์„œ ์™ธ๋ถ€ ์—ฐ๊ฒฐ์ด ์—†์Œ์„ ํ™•์ธํ•˜๊ณ  ์ปดํ”Œ๋ผ์ด์–ธ์Šค ๊ธฐ๋ก์œผ๋กœ ๋ฌธ์„œํ™”ํ•˜์‹ญ์‹œ์˜ค.
  • ๊ฐ์‚ฌ ๋กœ๊ทธ: Ollama๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ ํ”„๋กฌํ”„ํŠธ-์‘๋‹ต ์Œ์„ ๊ธฐ๋กํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋‚ด๋ถ€ ๋ฐ์ดํ„ฐ ๊ฑฐ๋ฒ„๋„Œ์Šค ์ •์ฑ…์— ๋”ฐ๋ผ ๋ฏธ๋“ค์›จ์–ด๋ฅผ ์ถ”๊ฐ€ํ•˜์‹ญ์‹œ์˜ค. ๋กœ๊ทธ๋Š” ํ•ญ์ƒ ๋กœ์ปฌ์— ์ €์žฅํ•˜๊ณ  ํด๋ผ์šฐ๋“œ๋กœ ์ „์†กํ•˜์ง€ ๋งˆ์‹ญ์‹œ์˜ค.

์˜คํ”„๋ผ์ธ RAG ์„ค์ •

์™„์ „ ์˜คํ”„๋ผ์ธ ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ(RAG)์—๋Š” ๋กœ์ปฌ LLM + ๋กœ์ปฌ ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ + ๋กœ์ปฌ ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

  1. 1
    ์ž„๋ฒ ๋”ฉ ๋ชจ๋ธ: ์—ฐ๊ฒฐ๋œ ๊ธฐ๊ธฐ์—์„œ ollama pull nomic-embed-text๋ฅผ ์‹คํ–‰ํ•˜์‹ญ์‹œ์˜ค. Ollama ๋ชจ๋ธ ๋””๋ ‰ํ„ฐ๋ฆฌ์˜ ๋‚˜๋จธ์ง€ ํŒŒ์ผ๊ณผ ํ•จ๊ป˜ ์ „์†กํ•˜์‹ญ์‹œ์˜ค.
  2. 2
    ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค: Chroma๋Š” ๋‹จ๋… ๋ฐ”์ด๋„ˆ๋ฆฌ๋กœ ์‹คํ–‰ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค(Python ๋ถˆํ•„์š”). ๋˜๋Š” Qdrant ๋ฐ”์ด๋„ˆ๋ฆฌ๋‚˜ sqlite-vss ํ™•์žฅ์ด ํฌํ•จ๋œ SQLite๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  3. 3
    ๋ฌธ์„œ ์ˆ˜์ง‘: LangChain ๋˜๋Š” LlamaIndex๋ฅผ ์˜คํ”„๋ผ์ธ ์ƒํƒœ๋กœ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค(์—ฐ๊ฒฐ ํ•ด์ œ ์ „์— ํœ  ํŒŒ์ผ์„ ์„ค์น˜ํ•˜์‹ญ์‹œ์˜ค). ๋ฌธ์„œ ๋กœ๋”๋ฅผ ๋กœ์ปฌ ํŒŒ์ผ๋กœ ์ง€์ •ํ•˜๊ณ  ์›น ํฌ๋กค๋ง์€ ํ•˜์ง€ ๋งˆ์‹ญ์‹œ์˜ค.
  4. 4
    ์ฟผ๋ฆฌ ํ๋ฆ„: ๋ฌธ์„œ โ†’ ๋กœ์ปฌ nomic-embed-text ์ž„๋ฒ ๋”ฉ โ†’ ๋กœ์ปฌ ๋ฒกํ„ฐ DB์—์„œ ์ƒ์œ„ k๊ฐœ ์ฒญํฌ ๊ฒ€์ƒ‰ โ†’ ๋กœ์ปฌ Qwen3์œผ๋กœ ์ „๋‹ฌ โ†’ ์‘๋‹ต. ์™ธ๋ถ€ ํ˜ธ์ถœ ์—†์Œ.
  5. 5
    ํ…Œ์ŠคํŠธ: ์ „์ฒด RAG ์ฟผ๋ฆฌ ์‚ฌ์ดํด ๋™์•ˆ tcpdump -i any -n port 443์œผ๋กœ HTTPS ํŠธ๋ž˜ํ”ฝ์ด ์—†๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.

์ž์ฃผ ๋ฌป๋Š” ์งˆ๋ฌธ

Ollama๋Š” ์˜คํ”„๋ผ์ธ ์‹คํ–‰ ์‹œ ๋„คํŠธ์›Œํฌ ํ˜ธ์ถœ์„ ํ•ฉ๋‹ˆ๊นŒ?

๊ธฐ๋ณธ์ ์œผ๋กœ Ollama๋Š” ๋กœ์ปฌ์— ์บ์‹œ๋œ ๋ชจ๋ธ์„ ์„œ๋น™ํ•  ๋•Œ ๋„คํŠธ์›Œํฌ ํ˜ธ์ถœ์„ ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ollama.com์€ ๋ชจ๋ธ ๋‹ค์šด๋กœ๋“œ ๋˜๋Š” ์—…๋ฐ์ดํŠธ ์‹œ์—๋งŒ ์ ‘์†ํ•ฉ๋‹ˆ๋‹ค. ๋กœ์ปฌ ์บ์‹œ์™€ ํ•จ๊ป˜ OLLAMA_MODELS๋ฅผ ์„ค์ •ํ•˜๊ณ  ollama serve๋ฅผ ์‹คํ–‰ํ•˜๋ฉด ์™ธ๋ถ€ ์—ฐ๊ฒฐ์ด ๋ฐœ์ƒํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

NAS ๋งˆ์šดํŠธ ๊ฒฝ๋กœ์—์„œ Qwen3 72B๋ฅผ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋‹ค๋งŒ ๋ชจ๋ธ ๋กœ๋“œ ์‹œ NFS ์ง€์—ฐ์œผ๋กœ ์ธํ•ด ๋กœ๋”ฉ ์‹œ๊ฐ„์ด 10~30์ดˆ ๋” ์†Œ์š”๋ฉ๋‹ˆ๋‹ค. ๋กœ๋“œ ์™„๋ฃŒ ํ›„ ์ถ”๋ก  ์„ฑ๋Šฅ์€ ์Šคํ† ๋ฆฌ์ง€ ์†๋„๊ฐ€ ์•„๋‹Œ GPU/CPU์˜ VRAM์—๋งŒ ์˜์กดํ•ฉ๋‹ˆ๋‹ค.

์˜คํ”„๋ผ์ธ์—์„œ ํ•œ๊ตญ์–ด๋ฅผ ์ž˜ ์ฒ˜๋ฆฌํ•˜๋Š” ๊ฐ€์žฅ ์ž‘์€ ๋ชจ๋ธ์€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

Qwen3 7B Q4_K_M(VRAM 5.5 GB)์ž…๋‹ˆ๋‹ค. ํ•œ๊ตญ์–ด๋ฅผ ๋„ค์ดํ‹ฐ๋ธŒ ํ† ํฌ๋‚˜์ด์ €๋กœ ์ฒ˜๋ฆฌํ•˜๋ฉฐ, RTX 3060์—์„œ 50~80 tok/s๋กœ ์ผ๊ด€๋œ ์‘๋‹ต์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.

๋‚ด๋ถ€ ์˜คํ”„๋ผ์ธ ๋ฐฐํฌ์— ๊ทœ์ œ ๋ณด์•ˆ ํ‰๊ฐ€๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๊นŒ?

์ผ๋ฐ˜์ ์œผ๋กœ ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ AI ๊ทœ์ œ๋Š” ๊ณต๊ฐœ ์„œ๋น„์Šค์— ์ ์šฉ๋ฉ๋‹ˆ๋‹ค. ์ง์›๋งŒ ์‚ฌ์šฉํ•˜๋Š” ๋‚ด๋ถ€ ๋ฐฐํฌ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ์ ์šฉ ๋ฒ”์œ„ ๋ฐ–์ž…๋‹ˆ๋‹ค. ๊ตฌ์ฒด์ ์ธ ์ƒํ™ฉ์— ๋Œ€ํ•ด์„œ๋Š” ์ปดํ”Œ๋ผ์ด์–ธ์Šค ์ „๋ฌธ๊ฐ€์—๊ฒŒ ๋ฌธ์˜ํ•˜์‹ญ์‹œ์˜ค.

llama.cpp๋Š” ์‹œ์Šคํ…œ ์˜์กด์„ฑ ์—†์ด ์‹คํ–‰ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๊นŒ?

Linux์—์„œ๋Š” ์‚ฌ์ „ ์ปดํŒŒ์ผ๋œ ๋ฐ”์ด๋„ˆ๋ฆฌ๊ฐ€ GLIBC 2.28 ์ด์ƒ์„ ํ•„์š”๋กœ ํ•ฉ๋‹ˆ๋‹ค(Ubuntu 20.04 ์ด์ƒ์—๋Š” ํ‘œ์ค€ ํฌํ•จ). macOS arm64์—์„œ๋Š” ๋ฐ”์ด๋„ˆ๋ฆฌ๊ฐ€ ๋…๋ฆฝ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. Windows CUDA ๋นŒ๋“œ๋Š” CUDA ๋Ÿฐํƒ€์ž„ DLL์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

์—์–ด๊ฐญ ํ™˜๊ฒฝ์—์„œ ๋ชจ๋ธ์„ ์–ด๋–ป๊ฒŒ ์—…๋ฐ์ดํŠธํ•ฉ๋‹ˆ๊นŒ?

์—ฐ๊ฒฐ๋œ ๊ธฐ๊ธฐ์—์„œ ์—…๋ฐ์ดํŠธ๋œ GGUF๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  SHA256 ํ•ด์‹œ๋ฅผ ๊ฒ€์ฆํ•œ ํ›„ USB/SSD๋กœ ์ „์†กํ•˜์—ฌ ๋ชจ๋ธ ๋””๋ ‰ํ„ฐ๋ฆฌ์˜ ๊ธฐ์กด GGUF๋ฅผ ๊ต์ฒดํ•˜์‹ญ์‹œ์˜ค. Ollama ์„œ๋ฒ„๋ฅผ ์žฌ์‹œ์ž‘ํ•˜์—ฌ ์ƒˆ ํŒŒ์ผ์„ ์ธ์‹์‹œํ‚ค์‹ญ์‹œ์˜ค.

โ† ๊ณ ๊ธ‰ ๋กœ์ปฌ LLM์œผ๋กœ ๋Œ์•„๊ฐ€๊ธฐ

๋ฐฉํ™”๋ฒฝยท์—์–ด๊ฐญ ํ™˜๊ฒฝ LLM ์˜คํ”„๋ผ์ธ ๋ฐฐํฌ 2026 | PromptQuorum