Key Takeaways
- AMD RX 6800 XT(16GB, ์ค๊ณ $300-350)์ RX 7900 XTX(24GB, ์ค๊ณ $400-500)๋ ๋ก์ปฌ LLM์ ์ค์ง์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ ์ ์ผํ AMD ์ต์ ์ ๋๋ค.
- ๋ฌ๋ฌ๋น ์ฑ๋ฅ: AMD๋ NVIDIA๋ณด๋ค 20-30% ์ ๋ ดํ์ง๋ง, ์ํํธ์จ์ด ์ค์ ๋ถ๋ด์ผ๋ก 5-10์๊ฐ์ด ์ถ๊ฐ๋ก ์์๋ฉ๋๋ค.
- Ollama: AMD ์ง์์ด ์ ํ์ ์ ๋๋ค(ROCm ๊ฒฝ๋ก์ ๋ฒ๊ทธ ์กด์ฌ, CPU ํด๋ฐฑ ์๋ ๋๋ฆผ). ๊ถ์ฅํ์ง ์์ต๋๋ค.
- vLLM: v0.6.0๋ถํฐ AMD ROCm ์์ ์ง์. ๋จ, ์๋ ๋๋ผ์ด๋ฒ ์ค์น๊ฐ ํ์ํฉ๋๋ค. ์ค์ ์ ์๋ฃํ๋ฉด ์ ์๋ํฉ๋๋ค.
- Text Generation WebUI: ROCm์ ํตํ AMD ์ง์์ด ์ฐ์ํฉ๋๋ค. AMD์์ ์ต๊ณ ์ ์ฌ์ฉ์ ๊ฒฝํ์ ์ ๊ณตํฉ๋๋ค.
- Llama.cpp: AMD ๋ค์ดํฐ๋ธ ์ง์(HIP ๋ฐฑ์๋). ์์ ์ ์ธ ์ฑ๋ฅ. AMD์์ ๊ถ์ฅ๋๋ ๊ฒฝ๋ก์ ๋๋ค.
- ์ค์ ๋น์ฉ: ROCm ๋๋ผ์ด๋ฒ ๋๋ฒ๊น , HIPCC ์ปดํ์ผ, ์ปค๋ ํธํ์ฑ ํ์ธ์ 5-10์๊ฐ์ ๊ณํํ์ญ์์ค.
- ๊ฒฐ๋ก (2026๋ 4์): AMD ํ๋์จ์ด๋ฅผ ์ด๋ฏธ ๋ณด์ ํ๊ณ ์๊ฑฐ๋ ์ ๋ ดํ ์ค๊ณ ์ ํ(16GB ์นด๋ $300)์ ๋ฐ๊ฒฌํ ๊ฒฝ์ฐ์๋ง AMD๋ฅผ ์ ํํ์ญ์์ค. ๊ทธ๋ ์ง ์์ผ๋ฉด NVIDIA CUDA๊ฐ ์ฌ์ ํ ๋ ๊ฐํธํฉ๋๋ค.
์ค์ ๋ก ์ฌ์ฉํ ๋งํ AMD GPU๋?
- RX 6800 XT (16GB GDDR6): AMD ๊ฐ์ฑ๋น์ ์. 2020๋ ์ถ์. 7B-22B ์ถ๋ก ์ ์ฌ์ ํ ๊ฒฌ์คํฉ๋๋ค. ์ค๊ณ : $300-350.
- RX 6900 XT (16GB GDDR6): 6800 XT๋ณด๋ค ์ํญ ๋น ๋ฆ ๋๋ค. ํฌ๊ทํฉ๋๋ค. ์ค๊ณ : $350-400. ๊ฐ๊ฒฉ ์ฐจ์ด๋งํผ์ ๊ฐ์น๊ฐ ์์ต๋๋ค.
- RX 7900 XT (20GB GDDR6): ์ ํ RDNA 3 ์ํคํ ์ฒ. 6800 XT๋ณด๋ค 20% ๋น ๋ฆ ๋๋ค. ์ค๊ณ : $400-480. 70B Q4์ ์ ํฉํฉ๋๋ค.
- RX 7900 XTX (24GB GDDR6): AMD ์ต์์ ์๋น์์ฉ GPU. 24GB VRAM์ 70B ๋ชจ๋ธ ๊ตฌ๋์ ํ๋๋ฅผ ๋ฐ๊ฟ๋๋ค. ์ค๊ณ : $450-550. RTX 4090๊ณผ ์ ์ฌํ ์๋.
- Radeon Pro W6800 (32GB): ์ํฐํ๋ผ์ด์ฆ ์นด๋, ์ค๊ณ ๊ฐ๊ฒฉ์ด ์ ๋ ดํฉ๋๋ค(์ฝ $200-300). ์๋๋ ๋๋ฆฌ์ง๋ง 32GB๋ 70B Q8์ ํ์ํฉ๋๋ค. ํ์ ์ ํ์ง.
AMD GPU์ RTX์ ๊ฐ๊ฒฉยท์ฑ๋ฅ ๋น๊ต
| GPU | VRAM | TFLOPS | ์ค๊ณ ๊ฐ๊ฒฉ | ๋ฌ๋ฌ๋น ์ฑ๋ฅ vs. RTX | ๋๊ธ RTX |
|---|---|---|---|---|---|
| RX 6800 XT | 16GB | 1,952 | $300-350 | +25% | RTX 3080 (๋๋ฆผ) |
| RX 7900 XT | 20GB | 2,540 | $400-480 | +20% | RTX 4080 (์ ์ฌ) |
| RX 7900 XTX | 24GB | 2,750 | $450-550 | +15% | RTX 4090 (์ ์ฌ ์๋) |
| RTX 3080 | 10GB | 1,456 | $350-400 | -- | -- |
| RTX 4090 | 24GB | 2,752 | $1,000-1,300 | -- | -- |
AMD ROCm ์ค์ ์ ๋ถ๋ด์?
1. AMD ROCm ๋๋ผ์ด๋ฒ ์ค์น: `apt-get install rocm-dkms` (Ubuntu). Windows์์๋ ์๋ .exe ์ค์น ํ๋ก๊ทธ๋จ ์ฌ์ฉ. ์ฝ 30๋ถ ์์.
2. HIP ์ปดํ์ผ๋ฌ ํ์ธ: `hipcc --version`. ์ฒซ ์๋์์ ์คํจํ๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค. GPU ์ปค๋ ํธํ์ฑ์ ๋๋ฒ๊น ํ์ญ์์ค.
3. HIPCC(AMD HIP-to-C++ ์ปดํ์ผ๋ฌ) ์ค์น: `apt-get install hip-runtime-amd`. ๋ ๋ค๋ฅธ ์์กด์ฑ ์ฒด์ธ์ ๋๋ค.
4. ์ํ LLM์ผ๋ก ํ ์คํธ: ์ถ๋ก ์ ์คํํ์ฌ GPU ๊ฐ์์ด ์๋ํ๋์ง ํ์ธํฉ๋๋ค. CPU ํด๋ฐฑ์ด ์์ฃผ ๋ฐ์ํฉ๋๋ค.
5. ๋๋ผ์ด๋ฒ ๋ฒ์ ๋ถ์ผ์น ํด๊ฒฐ: ROCm v5.7์ ์ปค๋ 5.15์์ ์๋ํ์ง๋ง 6.x์์๋ ์๋ํ์ง ์์ต๋๋ค. 2-4์๊ฐ์ ๋๋ฒ๊น ์ด ํ์ํฉ๋๋ค.
NVIDIA CUDA์ ๋น๊ต: `nvidia-cuda-toolkit` โ apt-get ํ ๋ฒ์ผ๋ก ์ฆ์ GPU ์ ๊ทผ ๊ฐ๋ฅ. AMD๋ 5-10๋ฐฐ ๋ ๋ง์ ์ค์ ๋ถ๋ด์ด ์์ต๋๋ค.
AMD์์ Ollama์ vLLM์ ์คํํ ์ ์๋๊ฐ?
AMD์์์ Ollama: 2026๋ 4์ ๊ธฐ์ค ์คํ์ /๋ถ์์ ๋จ๊ณ. ROCm ๊ฒฝ๋ก๊ฐ ๋๋๋ก ์๋ํ์ง๋ง CPU ํด๋ฐฑ์ ๋๋ฆฝ๋๋ค. ๊ถ์ฅํ์ง ์์ต๋๋ค.
AMD์์์ vLLM: v0.6.0๋ถํฐ ์์ ํ ROCm ์ง์. ์ ์๋ํ์ง๋ง ROCm/HIP ๋๋ผ์ด๋ฒ ์๋ ์ค์ ์ด ํ์ํฉ๋๋ค. ์ค์ ์ ์๋ฃํ๋ฉด ์ข์ ์ฑ๋ฅ์ ๋ฐํํฉ๋๋ค.
Text Generation WebUI: AMD ROCm ์ง์์ด ์ฐ์ํฉ๋๋ค. AMD์์ ์ต๊ณ ์ ์ฌ์ฉ์ ๊ฒฝํ. ๊ถ์ฅํฉ๋๋ค.
Llama.cpp: ๋ค์ดํฐ๋ธ HIP ๋ฐฑ์๋. ์์ ์ ์ธ ์ฑ๋ฅ. ๊ฐ์ฅ ๊ฐํธํ AMD ๊ฒฝ๋ก. ๊ถ์ฅํฉ๋๋ค.
LM Studio: NVIDIA ์ ์ฉ. AMD ์ง์ ์์.
2026๋ 4์ ๊ธฐ์ค: vLLM + llama.cpp๊ฐ AMD์์์ ์ ํ์ง์ ๋๋ค. Ollama๋ ์ ๋ขฐํ ์ ์์ต๋๋ค.
AMD๋ฅผ NVIDIA ๋์ ์ ํํด์ผ ํ๋ ๊ฒฝ์ฐ
AMD๋ฅผ ๊ตฌ์ ํด์ผ ํ๋ ๊ฒฝ์ฐ:
- ์ค๊ณ RX 7900 XTX๋ฅผ $450 ๋ฏธ๋ง์ ๋ฐ๊ฒฌํ ๊ฒฝ์ฐ(RTX 4090 ๋๋น ์ ํ๊ฐ๋ ๊ฐ๊ฒฉ).
- ์ด๋ฏธ AMD ํ๋์จ์ด๋ฅผ ๋ณด์ ํ๊ณ ์์ผ๋ฉฐ ์์ฝ์์คํ ์ผ๊ด์ฑ์ ์ํ๋ ๊ฒฝ์ฐ.
- ํด๋ฌ์คํฐ๋ฅผ ๊ตฌ์ถ ์ค์ด๋ฉฐ ์ค์ ํธ์์ฑ๋ณด๋ค ๋ฌ๋ฌ๋น ์ฐ์ฐ ์ฑ๋ฅ์ ์ฐ์ ์ํ๋ ๊ฒฝ์ฐ.
AMD๋ฅผ ๊ตฌ์ ํ์ง ๋ง์์ผ ํ๋ ๊ฒฝ์ฐ:
- ํ๋ฌ๊ทธ ์ค ํ๋ ์ด ๊ฒฝํ์ ์ํ๋ ๊ฒฝ์ฐ. NVIDIA CUDA๊ฐ ๋ ๋น ๋ฅด๊ฒ ์๋ํฉ๋๋ค.
- Ollama๊ฐ ํ์ํ ๊ฒฝ์ฐ. AMD ์ง์์ด ๋ถ์์ ํฉ๋๋ค.
- ์๊ฐ์ด ์ ํ๋์ด ์๋ ๊ฒฝ์ฐ. ROCm ๋๋ฒ๊น ์ 10์๊ฐ ์ด์ ์์๋ ์ ์์ต๋๋ค.
AMD ๋์ ์ ํํ ์ค์
- RX 6700(12GB)์ 3060 12GB์ ๋๊ธ์ผ๋ก ์ฐฉ๊ฐํ๊ณ ๊ตฌ์ ํ๋ ๊ฒ โ 20% ๋๋ฆฌ๋ฉฐ ์ค๊ณ ์์ฅ์์ ์ฐพ๊ธฐ๋ ์ด๋ ต์ต๋๋ค.
- ROCm์ด CUDA์ฒ๋ผ "๊ทธ๋ฅ ์๋"ํ๋ค๊ณ ๊ฐ์ ํ๋ ๊ฒ โ ๋๋ผ์ด๋ฒ ๋ฐ ์ปค๋ ํธํ์ฑ ๋๋ฒ๊น ์ 5-10์๊ฐ์ ๊ณํํ์ญ์์ค.
- AMD์์ Ollama๋ฅผ ์ฌ์ฉํ๋ฉฐ ์ํํ ํตํฉ์ ๊ธฐ๋ํ๋ ๊ฒ โ ROCm ๊ฒฝ๋ก์ ๋ฒ๊ทธ๊ฐ ์์ต๋๋ค. llama.cpp ๋๋ vLLM์ด ๋ ๋์ ์ ํ์ ๋๋ค.
์์ฃผ ๋ฌป๋ ์ง๋ฌธ
๋ก์ปฌ LLM์ฉ์ผ๋ก AMD RX 6800 XT์ NVIDIA RTX 3080 ์ค ์ด๋ ๊ฒ์ ๊ตฌ์ ํด์ผ ํฉ๋๊น?
๋จ์ํจ์ ์ค์ํ๋ค๋ฉด RTX 3080(CUDA๋ ๋ฐ๋ก ์๋ํฉ๋๋ค). 25% ๋ ๋์ ๊ฐ์ฑ๋น๋ฅผ ์ํ๊ณ 5-10์๊ฐ์ ROCm ์ค์ ์ ๊ฐ์ํ ์ ์๋ค๋ฉด RX 6800 XT๋ฅผ ๊ถ์ฅํฉ๋๋ค.
AMD RX 7900 XTX๊ฐ RTX 4090๋ณด๋ค ์ฐ์ํฉ๋๊น?
์๋๋ ๋น์ทํ๊ณ VRAM๋ ๋์ผ(24GB)ํฉ๋๋ค. RX 7900 XTX๋ ์ค๊ณ ๊ธฐ์ค $200-300 ๋ ์ ๋ ดํฉ๋๋ค($450-550 ๋ $1,000-1,300). ROCm ์ค์ ์ด ํธ๋ ์ด๋์คํ์ ๋๋ค.
AMD GPU๋ก Ollama๋ฅผ ์ฌ์ฉํ ์ ์์ต๋๊น?
๊ธฐ์ ์ ์ผ๋ก๋ ๊ฐ๋ฅํ์ง๋ง ๋ถ์์ ํ ๋์์ด ์์๋ฉ๋๋ค. CPU ํด๋ฐฑ์ด ์์ฃผ ๋ฐ์ํฉ๋๋ค. AMD์์๋ vLLM ๋๋ llama.cpp๋ฅผ ์ฌ์ฉํ์ญ์์ค.
2026๋ ๋ก์ปฌ LLM์ ์ํ ์ต์ ์ AMD ๊ฒฝ๋ก๋ ๋ฌด์์ ๋๊น?
Llama.cpp(HIP ๋ฐฑ์๋) + Text Generation WebUI์ ๋๋ค. ๋ ๋๊ตฌ ๋ชจ๋ AMD ์ง์์ด ๊ฒฌ์คํฉ๋๋ค. Ollama๋ ํผํ์ญ์์ค.
AMD ROCm์ Ubuntu๊ฐ ํ์ํฉ๋๊น, ์๋๋ฉด Windows์์๋ ์๋ํฉ๋๊น?
Windows ์ง์(HIP on Windows)๋ ์์ง๋ง ๋ ์ต์ ์ด๊ณ ๋ฒ๊ทธ๊ฐ ๋ง์ต๋๋ค. Ubuntu๊ฐ ๊ถ์ฅ ๊ฒฝ๋ก์ ๋๋ค.
RX 6700 ๋๋ 6750์ 7B ๋ชจ๋ธ์ ์ ํฉํฉ๋๊น?
RX 6700(12GB)์ ์๋ํ์ง๋ง RX 6800 XT๋ณด๋ค 20% ๋๋ฆฝ๋๋ค. $250 ๋ฏธ๋ง์ผ ๊ฒฝ์ฐ์๋ง ๊ตฌ์ ํ์ญ์์ค. ๊ทธ๋ ์ง ์์ผ๋ฉด 6800 XT๋ฅผ ์ ํํ์ญ์์ค.
ํ๋์ ์์คํ ์์ AMD์ NVIDIA GPU๋ฅผ ํผ์ฉํ ์ ์์ต๋๊น?
์ด๋ก ์ ์ผ๋ก๋ ๊ฐ๋ฅํ์ง๋ง ๊ด๋ฆฌ๊ฐ ๋งค์ฐ ๋ณต์กํฉ๋๋ค. ๊ฐ GPU๋ง๋ค ๋ณ๋์ CUDA/HIP ๋ฐํ์์ด ํ์ํฉ๋๋ค. ๊ถ์ฅํ์ง ์์ต๋๋ค.
๊ด๋ จ ์๋ฃ
- ๋ก์ปฌ LLM์ฉ ์ ์์ฐ ์ต๊ณ GPU
- ๋ก์ปฌ LLM์ฉ ์ต๊ณ ์ GPU
- GPU vs CPU vs Apple Silicon
- Text Generation WebUI vs vLLM vs Llama.cpp
- ๋ก์ปฌ LLM์ฉ ๋ ธํธ๋ถ vs ๋ฐ์คํฌํฑ โ AI๋ฅผ ์ํ ๋ ธํธ๋ถ๊ณผ ๋ฐ์คํฌํฑ์ ๋น์ฉ ๋ฐ ์ฑ๋ฅ ๋น๊ต.
์ฐธ๊ณ ์๋ฃ
- AMD ROCm ๊ณต์ ๋ฌธ์ ๋ฐ GitHub: HIP ์ปดํ์ผ๋ฌ, ๋๋ผ์ด๋ฒ ํธํ์ฑ ๋งคํธ๋ฆญ์ค, LLM ์ถ๋ก ์์
- vLLM GitHub: AMD/ROCm ๋ฐฑ์๋ ๊ตฌํ ๋ฐ ์ง์ ํํฉ(v0.6.0+)
- Llama.cpp GitHub: AMD GPU ์ง์์ ์ํ HIP ๋ฐฑ์๋
- AMD GPU๋ ์ด๋น ํ ํฐ ์๋๊ฐ ์ฐ์ํ์ง๋ง, ์๋๋ง์ผ๋ก ์๋ต ํ์ง์ด ๊ฒฐ์ ๋์ง๋ ์์ต๋๋ค. ๋ชจ๋ธ์๊ฒ ๋ฌด์์ ๋ฌป๋๋๊ฐ ์๋ต ์๋๋งํผ ์ค์ํฉ๋๋ค. context windows explained์์๋ GPU ๋ฉ๋ชจ๋ฆฌ ํ๊ณ ๋ด์์ ๊ธด ์์ฒญ์ ๊ตฌ์ฑํ๋ ๋ฐฉ๋ฒ์ ์ค๋ช ํฉ๋๋ค.