Key Takeaways
- Jais 30B (Core42/G42, ์๋ถ๋ค๋น): 2026๋ ์ต๊ณ ์ ์๋์ด ๋ค์ดํฐ๋ธ ๋ก์ปฌ LLM์ ๋๋ค. 126B ์๋์ด + 251B ์์ด ํ ํฐ์ผ๋ก ํ๋ จ๋์์ต๋๋ค. Apache 2.0 ๋ผ์ด์ ์ค. Q4 ์์ํ ์ ~18-20 GB VRAM์ด ํ์ํฉ๋๋ค(์ ์ฒด FP16์ ๊ฒฝ์ฐ ๋ฉํฐ GPU ๋๋ ์ํฐํ๋ผ์ด์ฆ GPU ํ์).
- Falcon Arabic 7B (TII, ์๋ถ๋ค๋น): UAE ๋ค์ดํฐ๋ธ ์๋์ด ์ค์ฌ ๋ชจ๋ธ์ ๋๋ค. ์๋น์ GPU์์ ์คํ๋ฉ๋๋ค: Q4_K_M ~5 GB VRAM. Falcon 3-7B ์ํคํ ์ฒ ๊ธฐ๋ฐ์ด๋ฉฐ, ๋ค์ดํฐ๋ธ(๋น๋ฒ์ญ) ์๋์ด ๋ฐ์ดํฐ์ ์ผ๋ก ํ๋ จ๋์์ต๋๋ค.
- Qwen3-8B (Alibaba Cloud): ๊ฐ๋ ฅํ ์๋์ด ์ง์์ ๊ฐ์ถ ์ต๊ณ ์ ๋ค๊ตญ์ด ์ต์ ์ ๋๋ค. HELM Arabic์์ ํ๊ท 0.786(235B ๋ณํ); 8B๋ Q4์์ ~5-6 GB VRAM์ ๋ง์ต๋๋ค. 119๊ฐ ์ธ์ด ์ง์.
- ALLaM 34B (HUMAIN/SDAIA, ์ฌ์ฐ๋์๋ผ๋น์): ์ฌ์ฐ๋ ๊ตญ๊ฐ ๋ชจ๋ธ๋ก, HUMAIN Chat์ ๊ตฌ๋ํฉ๋๋ค. ๊ณต๊ฐ ์ ๊ทผ์ฉ ์ฐ๊ตฌ/๋น์์ ์ฉ ๋ผ์ด์ ์ค์ ๋๋ค. Microsoft Azure AI์์ ์ด์ฉ ๊ฐ๋ฅ(7B ๋ณํ).
- MSA vs. ๋ฐฉ์ธ: ๋ชจ๋ ๋ชจ๋ธ์ด ํ๋ ํ์ค ์๋์ด(MSA)๋ฅผ ์ ์ฒ๋ฆฌํฉ๋๋ค. ๋ฐฉ์ธ ์ปค๋ฒ๋ฆฌ์ง๋ ๋ค์ํฉ๋๋ค โ ๋์ ๋ณํ์ ์ค์ ์์๋ก ํน์ ์ฌ์ฉ ์ฌ๋ก๋ฅผ ํ ์คํธํ์ญ์์ค.
- ๋ฐฐํฌ: Ollama๋ Falcon 3๋ฅผ ๋ค์ดํฐ๋ธ๋ก ์ง์ํฉ๋๋ค(ollama pull falcon3:7b). Jais์ ALLaM์ llama.cpp/Ollama์ฉ์ผ๋ก Hugging Face์์ GGUF ๋ณํ์ด ํ์ํฉ๋๋ค.
- ๋ฐ์ดํฐ ์ฃผ๊ถ: ์๋์ด NLP๋ฅผ ๋ก์ปฌ์์ ์คํํ๋ฉด ๊ฐ์ธ์ ๋ณด๊ฐ ๊ตญ๊ฒฝ ๋ด์ ์ ์ง๋ฉ๋๋ค โ UAE PDPL, ์ฌ์ฐ๋ NDMO ๋ฐ ๊ฑธํ ๋ฐ์ดํฐ ์ฃผ๊ถ ๋ชฉํ์ ๋ถํฉํฉ๋๋ค.
Jais 30B (Apache 2.0, ์๋ถ๋ค๋น)์ Falcon Arabic 7B (TII, ์๋ถ๋ค๋น)๋ 2026๋ ์ต๊ณ ์ ์๋์ด ๋ค์ดํฐ๋ธ ๋ก์ปฌ LLM์ด๋ฉฐ, Qwen3-8B๋ ์๋น์ ํ๋์จ์ด์ฉ ๋ค๊ตญ์ด ์๋์ด ๋ฒค์น๋งํฌ๋ฅผ ์ ๋ํฉ๋๋ค.
์์ฒด ์๋ฒ์์ ์คํํ ์ ์๋ ์ต๊ณ ์ ์๋์ด AI: ์ต๊ณ ์ ์๋์ด ํ์ง์ ์ํ Jais 30B(๊ณ ๊ธ GPU ํ์), ์ผ๋ฐ ์ปดํจํฐ์ฉ Falcon Arabic 7B, ๋๋ ๋ค๋ฅธ ์ธ์ด๋ ํ์ํ๋ค๋ฉด Qwen3-8B.
์๋์ด ์ง์ ๋ก์ปฌ LLM์ด ์ค์ํ ์ด์
์๋์ด๋ ๊ฑธํ, ๋ ๋ฐํธ, ๋ถ์ํ๋ฆฌ์นด ์ ์ญ์์ 3์ต ๋ช ์ด์์ ํ์๊ฐ ์ฌ์ฉํ๋ ๋ชจ๊ตญ์ด์ ๋๋ค. UAE, ์ฌ์ฐ๋์๋ผ๋น์, ์นดํ๋ฅด, ์ด์งํธ ๋ฐ ๊ทธ ์ธ ์ง์ญ์ ์ํฐํ๋ผ์ด์ฆ AI์์ ์๋์ด ํ์ง์ ์ค์ง์ ์ธ ์๊ตฌ ์ฌํญ์ด๋ฉฐ ๋์ค์ ๊ณ ๋ คํ ์ฌํญ์ด ์๋๋๋ค.
MSA vs. ๋ฐฉ์ธ ์๋์ด. ํ๋ ํ์ค ์๋์ด(ุงููุตุญู / MSA)๋ ๋ฏธ๋์ด, ์ ๋ถ, ๊ต์ก์์ ์ฌ์ฉ๋๋ ๊ณต์ ๋ฌธ์ด ํ์ค์ ๋๋ค. ์ง์ญ ๋ฐฉ์ธ(๊ฑธํ, ์ด์งํธ, ๋ ๋ฐํธ, ๋ชจ๋ก์ฝ)์ ์๋นํ ๋ค๋ฆ ๋๋ค โ MSA๋ก๋ง ํ๋ จ๋ ๋ชจ๋ธ์ ๊ฑธํ ๋ฐฉ์ธ ์ ๋ ฅ์ ์๋ชป ์ฝ์ ์ ์์ต๋๋ค. ์ํฐํ๋ผ์ด์ฆ ์ฌ์ฉ ์ฌ๋ก์์๋ ๋ ๋ค ํ ์คํธํด์ผ ํฉ๋๋ค.
๋ฐ์ดํฐ ์ฃผ๊ถ์ด ๋ ๋ฒ์งธ ๋์ธ์ ๋๋ค. ๊ฑธํ ๊ท์ ๋น๊ตญ(UAE PDPL, ์ฌ์ฐ๋์๋ผ๋น์ NDMO)์ ๊ตญ๊ฒฝ ๊ฐ ๊ฐ์ธ์ ๋ณด ์ด์ ์ ์ ํํฉ๋๋ค. ์๋์ด ๊ณ ๊ฐ ๋๋ ํ์ ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๊ตญ ํธ์คํ ํด๋ผ์ฐ๋ API๋ก ์ ์กํ๋ฉด ์ด์ ์ํ์ด ๋ฐ์ํฉ๋๋ค. ์๋์ด NLP๋ฅผ ๋ก์ปฌ์์ ์คํํ๋ฉด ๊ทธ ์ํ์ด ์ ๊ฑฐ๋ฉ๋๋ค. UAE PDPL ๋ฐ์ดํฐ ์ฃผ๊ถ ๊ฐ์ด๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
"๋ฒ์ญ๋ ์์ด" ํ์ง ๊ฒฉ์ฐจ. ๋ง์ ๋ฒ์ฉ LLM์ด ์๋์ด ์ง์์ ์ฃผ์ฅํ์ง๋ง ์ฃผ๋ก ๋ฒ์ญ๋ ์์ด ๋ฐ์ดํฐ๋ก ๋ฏธ์ธ ์กฐ์ ๋์์ต๋๋ค. ์๋์ด์ ํ ํฐํ๋ ๋นํจ์จ์ ์ผ ์ ์์ต๋๋ค(์๋์ด ์คํฌ๋ฆฝํธ๋ ์ ์ ํ ์ค๋ฅธ์ชฝ์์ ์ผ์ชฝ ํ ํฐํ๊ฐ ํ์ํจ). Jais ๋ฐ Falcon Arabic๊ณผ ๊ฐ์ ์ง์ ํ ์ด์ค ์ธ์ด ๋ชจ๋ธ์ ์๋์ด ์ฝํผ์ค๋ก ๋ค์ดํฐ๋ธ๋ก ํ๋ จ๋ฉ๋๋ค.
์ต๊ณ ์ ์๋์ด ๋ก์ปฌ LLM: ์จํ๋ ๋ฏธ์ค ๋ฐฐํฌ๋ฅผ ์ํ ์์
์๋์ด ๋ฅ๋ ฅ ๋ฐ ๋ก์ปฌ/์จํ๋ ๋ฏธ์ค ๋ฐฐํฌ ์ ํฉ์ฑ์ ๋ฐ๋ผ ์์๋ฅผ ๋งค๊ฒผ์ต๋๋ค.
- 1. Jais 30B โ ์ต๊ณ ์ ์๋์ด ํ์ง (Apache 2.0, ์จํ๋ ๋ฏธ์ค ์ค๋น ์๋ฃ). ๊ฐ๋ฐ์ฌ: Core42 / Inception AI (G42 ๊ทธ๋ฃน, ์๋ถ๋ค๋น) + MBZUAI ์ฐ๊ตฌ + Cerebras ํ๋ จ. ํ๋ จ: 126B ์๋์ด ํ ํฐ + 251B ์์ด ํ ํฐ + 50B ์ฝ๋ ํ ํฐ. ์ธ๊ฐ ํ๊ฐ์์ Jais 30B๋ ํ๊ฐ์ 96%์์ ์๋์ด๋ก Jais 13B๋ฅผ ๋ฅ๊ฐํฉ๋๋ค. ๋ผ์ด์ ์ค: Apache 2.0(์์ ๊ณต๊ฐ, ์์ ์ ์ฌ์ฉ ํ์ฉ). Hugging Face: inceptionai/jais-30b-v3. VRAM: ~18-20 GB Q4 ์ถ์ ์น(FP16์ ๊ฒฝ์ฐ ์ํฐํ๋ผ์ด์ฆ GPU ๋๋ ๋ฉํฐ GPU). ์ต์ ์ฉ๋: ์๋์ด๊ฐ ์ฃผ๋ ์ํฐํ๋ผ์ด์ฆ ๋ฌธ์ ์ฒ๋ฆฌ, ๊ณ ๊ฐ ์ง์, ์ ๋ถ ๋ฐฐํฌ์์ ์ต๊ณ ์ ์๋์ด ํ์ง.
- 2. Falcon Arabic 7B โ ์๋น์ ํ๋์จ์ด์ ์ต์ (TII ์๋ถ๋ค๋น). ๊ฐ๋ฐ์ฌ: Technology Innovation Institute (TII), ์๋ถ๋ค๋น(Advanced Technology Research Council ์ฐํ). ๊ธฐ๋ฐ: Falcon 3-7B ์ํคํ ์ฒ(December 17, 2024 ์ถ์). ํ๋ จ: ๋ค์ดํฐ๋ธ(๋น๋ฒ์ญ) ์๋์ด ๋ฐ์ดํฐ์ , MSA ๋ฐ ์ง์ญ ๋ฐฉ์ธ. ๋ผ์ด์ ์ค: Falcon LLM License โ ํ์ฉ์ , ์์ ์ ์ฌ์ฉ ํ์ฉ. VRAM: Q4_K_M ~5 GB โ RTX 4060 8GB, RTX 3060 12GB ๋ฐ ๋๊ธ์์ ์คํ. ์ต์ ์ฉ๋: ์๋น์ ๋ฐ ํ๋ก์๋จธ ํ๋์จ์ด ๋ฐฐํฌ; ์๋ถ๋ค๋น ๊ธฐ๊ด์ UAE ๋ค์ดํฐ๋ธ ๋ชจ๋ธ.
- 3. Qwen3-8B โ ๊ฐ๋ ฅํ ์๋์ด๋ฅผ ๊ฐ์ถ ์ต๊ณ ์ ๋ค๊ตญ์ด ์ต์ (Alibaba Cloud). ๊ฐ๋ฐ์ฌ: Alibaba Cloud. ์ธ์ด: 119๊ฐ ์ธ์ด ๋ฐ ๋ฐฉ์ธ. ๋ฒค์น๋งํฌ: Qwen3-235B-A22B๋ HELM Arabic์์ ํ๊ท 0.786์ ๊ธฐ๋ก; ๋ก์ปฌ ํ๋์จ์ด์๋ 8B ๋ณํ์ด ๊ถ์ฅ๋ฉ๋๋ค. ๋ผ์ด์ ์ค: Apache 2.0. VRAM: Q4_K_M ~5-6 GB. ์ต์ ์ฉ๋: ํ๋์ ๋ชจ๋ธ์ ์๋์ด + ์์ด + ๊ธฐํ ์ธ์ด๊ฐ ํ์ํ ํ; Ollama์์ ํญ๋๊ฒ ์ง์๋จ(ollama pull qwen3:8b).
- 4. ALLaM 34B / 7B โ ์ฌ์ฐ๋ ๊ตญ๊ฐ ๋ชจ๋ธ (HUMAIN/SDAIA). ๊ฐ๋ฐ์ฌ: SDAIA (Saudi Data and AI Authority) / HUMAIN (์ฌ์ฐ๋ ๊ตญ๊ฐ AI ํ์ฌ). ๋ฒ์ : 7B(Hugging Face, ์ฐ๊ตฌ ์ ๊ทผ) ๋ฐ 34B(HUMAIN Chat ๊ตฌ๋). Azure: ALLaM-2-7B-Instruct๋ September 2024๋ถํฐ Microsoft Azure AI์์ ์ด์ฉ ๊ฐ๋ฅ. ๋ผ์ด์ ์ค: ๊ณต๊ฐ ์ ๊ทผ์ฉ ์ฐ๊ตฌ/๋น์์ ์ฉ; HUMAIN์ ํตํ ์ํฐํ๋ผ์ด์ฆ ๋ผ์ด์ ์ฑ. ์ต์ ์ฉ๋: ์ฌ์ฐ๋ ์ ๋ถ ๋ฐ ์ํฐํ๋ผ์ด์ฆ ๋ฐฐํฌ; Vision 2030์ ๋ถํฉํ๋ ์ฃผ๊ถ ๋ชจ๋ธ.
- 5. Llama 3.1-8B-Instruct โ ์ต๊ณ ์ ์ผ๋ฐ ๋ค๊ตญ์ด ๊ธฐ์ค์ (Meta). ๊ฐ๋ฐ์ฌ: Meta. ์ธ์ด: ์๋์ด ํฌํจ 20๊ฐ ์ด์. ๋ผ์ด์ ์ค: Meta Llama 3.1 License โ ํ์ฉ์ , ๊ด๋ฒ์ํ ์์ ์ ์ฌ์ฉ. VRAM: Q4_K_M ~5-6 GB. ์ต์ ์ฉ๋: ๊ด๋ฒ์ํ ๋ค๊ตญ์ด ์ง์๋ ํ์ํ ์๋์ด ์ํฌ๋ก๋; ํญ๋์ ์ปค๋ฎค๋ํฐ ์ง์๊ณผ ํจ๊ป ๋๋ฆฌ ๋ฐฐํฌ๋จ. ์๋์ด ํ์ง์ด ์ฃผ๋ ๊ด์ฌ์ฌ๋ผ๋ฉด Qwen3-8B ๋๋ Jais๋ฅผ ์ฌ์ฉํ์ญ์์ค.
- 6. Gemma 3 (4B/12B) โ ์๋์ด ํฌํจ ๊ฐ๋ ฅํ ๋ค๊ตญ์ด (Google). ๊ฐ๋ฐ์ฌ: Google. ์ธ์ด: ์๋์ด(MSA ๋ฐ ๊ณ ์ ) ํฌํจ 140๊ฐ ์ด์. ๋ผ์ด์ ์ค: Gemma Terms of Use(๋๋ถ๋ถ์ ์์ ์ ์ฉ๋์ ํ์ฉ์ ). VRAM: 4B๋ Q4 ~3 GB; 12B๋ Q4 ~8 GB. ์ต์ ์ฉ๋: ์ด๋ฏธ Google ์ํ๊ณ์ ์๋ ํ; ๋ค๊ตญ์ด ๋ฒ์ญ ๋ฐ ์์ฝ; ์๋์ด ์คํฌ๋ฆฝํธ ๋ฌธ์ ์ฒ๋ฆฌ.
์๋์ด ๋ก์ปฌ LLM์ VRAM ์๊ตฌ ์ฌํญ
๋ชจ๋ธ ๋ฐ ์์ํ๋ณ ํ์ VRAM์ ๋๋ค. *๋ก ํ์๋ ํ์ ํ๋ผ๋ฏธํฐ ์ค์ผ์ผ๋ง ์ถ์ ์น์ ๋๋ค(๊ณต์ ๋ฒค์น๋งํฌ ์์). ๋ฐฐํฌ ์ ์ ํญ์ ํน์ ํ๋์จ์ด๋ก ํ์ธํ์ญ์์ค.
| ๋ชจ๋ธ | ํ๋ผ๋ฏธํฐ | Q4_K_M VRAM | FP16 VRAM | ์ต์ ํ๋์จ์ด |
|---|---|---|---|---|
| Falcon Arabic | 7B | ~5 GB | ~16.7 GB | RTX 4060 8 GB / RTX 3060 12 GB |
| Jais 13B | 13B | ~8-10 GB* | ~26 GB* | RTX 3090 24 GB (Q4) |
| Jais 30B | 30B | ~18-20 GB* | ~60 GB* | RTX 4090 24 GB (Q4 ๋น ๋ฏํจ), A100 40 GB (FP16) |
| ALLaM | 7B | ~5 GB* | ~16 GB* | RTX 4060 8 GB / RTX 3060 12 GB |
| Qwen3 | 8B | ~5-6 GB | ~16 GB | RTX 4060 8 GB / RTX 3060 12 GB |
| Llama 3.1 | 8B | ~5-6 GB | ~16 GB | RTX 4060 8 GB / RTX 3060 12 GB |
| Gemma 3 | 4B | ~3 GB | ~8 GB | RTX 3060 8 GB |
Ollama๋ก ์๋์ด ๋ชจ๋ธ์ ์จํ๋ ๋ฏธ์ค์์ ์คํํ๋ ๋ฐฉ๋ฒ
GPU ์๋ฒ ๋๋ ์ํฌ์คํ ์ด์ ์์ ์๋์ด ๋ชจ๋ธ์ ๋ก์ปฌ๋ก ๋ฐฐํฌํ๋ ๋จ๊ณ๋ณ ๋ฐฉ๋ฒ์ ๋๋ค.
- 1Ollama ์ค์น: curl -fsSL https://ollama.com/install.sh | sh (Linux) ๋๋ ollama.com์์ ๋ค์ด๋ก๋(Windows/Mac). Falcon 3๋ฅผ ๋ค์ดํฐ๋ธ๋ก ์ง์ํฉ๋๋ค.
- 2Falcon Arabic 7B ๋ฐ๊ธฐ: ollama pull falcon3:7b โ ~5 GB ๋ค์ด๋ก๋. ์คํ: ollama run falcon3:7b. "ุงูุชุจ ูุตูุฏุฉ ุนู ุฃุจูุธุจู"(์๋ถ๋ค๋น์ ๊ดํ ์๋ฅผ ์ฐ์ธ์)์ ๊ฐ์ ํ๋กฌํํธ๋ก ์๋์ด๋ฅผ ํ ์คํธํ์ญ์์ค.
- 3๋ค๊ตญ์ด์ฉ Qwen3-8B ๋ฐ๊ธฐ: ollama pull qwen3:8b โ ~5 GB ๋ค์ด๋ก๋. MSA ๋ฐ ๋ฐฉ์ธ ๋งฅ๋ฝ ์ ๋ฐ์์ ๊ฐ๋ ฅํ ์๋์ด.
- 4Jais 30B์ ๊ฒฝ์ฐ: Hugging Face(inceptionai/jais-30b-v3)์์ ๋ค์ด๋ก๋ํ๊ณ , llama.cpp ๋ณํ ๋๊ตฌ๋ก GGUF๋ก ๋ณํํ๊ณ , Q4_K_M์ผ๋ก ์์ํํ ๋ค์, Ollama(ollama create jais-30b -f Modelfile) ๋๋ llama.cpp ์๋ฒ๋ก ๋ก๋ํ์ญ์์ค.
- 5ํ๋ก๋์ ์ถ๋ก : ๊ณ ์ฒ๋ฆฌ๋ ์๋์ด API ์๋น์ vLLM์ ์ฌ์ฉํ์ญ์์ค. vLLM์ Falcon 3์ Qwen3๋ฅผ ๋ค์ดํฐ๋ธ๋ก ์ง์ํฉ๋๋ค. localhost:8000์์ OpenAI ํธํ ์๋ํฌ์ธํธ๋ก ๋ ธ์ถํ์ญ์์ค.
- 6์๋์ด ํ๋กฌํํธ ํ: ํญ์ ์ธ์ด๋ฅผ ์ง์ ํ์ญ์์ค โ "ุฃุฌุจ ุจุงููุบุฉ ุงูุนุฑุจูุฉ ุงููุตุญู"(ํ๋ ํ์ค ์๋์ด๋ก ๋ตํ์ธ์). ๋ฐฉ์ธ์ ๊ฒฝ์ฐ, ์์คํ ํ๋กฌํํธ์ ๋์ ๋ฐฉ์ธ์ ์์ ๋ฌธ์ฅ์ ํฌํจํ์ญ์์ค.
์ฌ์ฉ ์ฌ๋ก์ ๋ง๋ ์๋์ด LLM ํ์ง์ ํ๊ฐํ๋ ๋ฐฉ๋ฒ
๋ฒค์น๋งํฌ๋ ์ถ๋ฐ์ ์ ์ ๊ณตํฉ๋๋ค. ์ค์ ์๋์ด ํ์ง์ ํน์ ๋๋ฉ์ธ๊ณผ ๋ฐฉ์ธ์์ ํ๊ฐํด์ผ ํฉ๋๋ค.
- HELM Arabic (Stanford CRFM): ์ ์ฒด๋ก ์ ๋ค๊ตญ์ด ํ๊ฐ. Qwen3-235B๋ ํ๊ท 0.786์ ๊ธฐ๋กํ์ต๋๋ค. ๋ชจ๋ธ ๊ฐ ์๋์ ๋น๊ต ๊ธฐ์ค์ผ๋ก ์ฌ์ฉํ์ญ์์ค โ ๋๋ฉ์ธ์ ์ ๋์ ํ์ง ์ ์๊ฐ ์๋๋๋ค.
- ALUE (Arabic Language Understanding Evaluation): ๊ฐ์ฑ ๋ถ์, ์ ์ฅ ํ์ง, ๋ฐฉ์ธ ์๋ณ์ ํฌํจํ 8๊ฐ NLU ์์ . ํธ์ํฐ ์ค์ฌ ๋ฐ์ดํฐ์ โ ์์ ๋ฏธ๋์ด ๋ฐ ๊ณ ๊ฐ ํผ๋๋ฐฑ ์ฌ์ฉ ์ฌ๋ก์ ์ ํฉํฉ๋๋ค.
- ArabicMMLU: MSA์ ํ์ ๋ฐ ์ ๋ฌธ ์ง์ ์์ . ์ํฐํ๋ผ์ด์ฆ ์ง์ ๋ฒ ์ด์ค ๋ฐ ๋ฌธ์ Q&A ํ์ง์ ๊ฐ์ฅ ์ ํฉํ ๋ฒค์น๋งํฌ์ ๋๋ค.
- AraBench: ๋ฐฉ์ธ๋ณ ๋ฒ์ญ ํ์ง(์ด์งํธ, ์๋ฆฌ์, ๊ฑธํ). ์ฌ์ฉ ์ฌ๋ก์ ํนํ ๊ฑธํ ์๋์ด๊ฐ ํฌํจ๋๋ค๋ฉด ์ฌ๊ธฐ์ ํ ์คํธํ์ญ์์ค.
- ์์ฒด ํ๊ฐ(๊ถ์ฅ): ์ค์ ๋๋ฉ์ธ๊ณผ ๋์ ๋ฐฉ์ธ์ผ๋ก 20-30๊ฐ์ ํ ์คํธ ํ๋กฌํํธ๋ฅผ ์์ฑํ์ญ์์ค. (1) ์ฌ์ค ์ ํ์ฑ, (2) ์์ฐ์ค๋ฌ์ด ์๋์ด ๋ฌธ๋ฒ, (3) ์ ์ ํ ์ด์กฐ(๊ณต์ vs. ๋ฐฉ์ธ), (4) ์ถ๋ก ์์ ์ฌ๋ฐ๋ฅธ ์ค๋ฅธ์ชฝ์์ ์ผ์ชฝ ๊ตฌ์กฐ๋ก ์ถ๋ ฅ์ ์ฑ์ ํ์ญ์์ค.
- ์ํ ์ ํธ: ๋ชจ๋ธ์ด ์์ฒญ ์์ด ์๋ต ์ค๊ฐ์ ์์ด๋ก ์ ํํ๊ฑฐ๋ "๋ฒ์ญ๋" ํํ(์์ด ํจํด์์ ๋จ์ด ๋ ๋จ์ด ๋ฒ์ญ)์ ์์ฑํ๋ฉด, ํ๋ก๋์ ์๋์ด ์ฌ์ฉ์ ํ์ง์ด ๋ถ์ถฉ๋ถํฉ๋๋ค.
์๋์ด ๋ก์ปฌ LLM์ ๊ดํ ์์ฃผ ๋ฌป๋ ์ง๋ฌธ
์ผ๋ฐ ๊ฒ์ด๋ฐ ๋ ธํธ๋ถ์์ ์๋์ด LLM์ ์คํํ ์ ์์ต๋๊น?
์, Q4 ์์ํ์ 7B ํด๋์ค ๋ชจ๋ธ์ ๊ฒฝ์ฐ ๊ฐ๋ฅํฉ๋๋ค. Falcon Arabic 7B์ Qwen3-8B๋ ~5-6 GB VRAM์ด ํ์ํฉ๋๋ค โ RTX 4060(8 GB) ๋๋ RTX 3060(12 GB)์ ๊ฐ์ถ ๋๋ถ๋ถ์ ๊ฒ์ด๋ฐ ๋ ธํธ๋ถ์์ ์คํํ ์ ์์ต๋๋ค. Jais 30B๋ ๊ณ ๊ธ ๋ฐ์คํฌํฑ GPU(RTX 4090 24 GB) ๋๋ Q4 ์์ํ์ ์ํฐํ๋ผ์ด์ฆ GPU๊ฐ ํ์ํฉ๋๋ค.
Jais์ Falcon Arabic์ ์ฐจ์ด์ ์ ๋ฌด์์ ๋๊น?
๋ ๋ค ์๋ถ๋ค๋น์์ ์์๋ ์๋์ด ์ง์ ๋ชจ๋ธ์ ๋๋ค. Jais(Core42/G42)๋ ๋ ํฌ๊ณ (์ต๋ 30B) 126B ์๋์ด ํ ํฐ์ผ๋ก ์๋์ด-์์ด ์ด์ค ์ธ์ด๋ก ํน๋ณํ ํ๋ จ๋์์ต๋๋ค โ ์ํฐํ๋ผ์ด์ฆ ๊ท๋ชจ์์ ์๋์ด ํ์ง์ ์ต์ ํ๋์์ต๋๋ค. Falcon Arabic์ TII(๋ค๋ฅธ ์๋ถ๋ค๋น ๊ธฐ๊ด)์ 7B ๋ชจ๋ธ๋ก, ๋ ๊ด๋ฒ์ํ Falcon 3 ์ํคํ ์ฒ ๊ธฐ๋ฐ์ ๋๋ค โ ์๋น์ GPU ์นํ์ ์ด๋ฉฐ UAE AI ์ํ๊ณ์ ์ผ๋ถ์ ๋๋ค. ์ต๊ณ ์ ์๋์ด ํ์ง: Jais 30B. ์๋น์ ํ๋์จ์ด: Falcon Arabic 7B.
Qwen3๋ ์ ์ฉ ์๋์ด ๋ชจ๋ธ๋งํผ ์๋์ด๋ฅผ ์ง์ํฉ๋๊น?
Qwen3๋ ๋งค์ฐ ๊ฐ๋ ฅํ ์ผ๋ฐ ์๋์ด ์ง์(119๊ฐ ์ธ์ด, ์ ๋์ ์ธ HELM Arabic ์ ์)์ ๊ฐ์ถ๊ณ ์์ต๋๋ค. ์ ๋์ ์ผ๋ก ์ต๊ณ ์ ์๋์ด ํ์ง์ด ํ์ํ ์์ ์๋์ด ์ํฐํ๋ผ์ด์ฆ ๋ฐฐํฌ์ ๊ฒฝ์ฐ, ์ผ๋ฐ์ ์ผ๋ก Jais 30B๊ฐ ์ ํธ๋ฉ๋๋ค. ์๋์ด๊ฐ ํ์ํ ์ฌ๋ฌ ์ธ์ด ์ค ํ๋์ธ ํผํฉ ๋ค๊ตญ์ด ์ํฌ๋ก๋์ ๊ฒฝ์ฐ, ๊ทธ ํญ๊ณผ ๋ฐฐํฌ ์ฉ์ด์ฑ์ผ๋ก ์ธํด Qwen3-8B๊ฐ ๋ ๋์ ์ ํ์ธ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
ALLaM์ ๋ฌด์์ด๋ฉฐ ์์ ์ ์ผ๋ก ์ฌ์ฉํ ์ ์์ต๋๊น?
ALLaM์ SDAIA(ํ์ฌ HUMAIN ๋ธ๋๋ ์ฐํ)์ ์ฌ์ฐ๋ ๊ตญ๊ฐ ์๋์ด ์ค์ฌ LLM ์ ํ๊ตฐ์ ๋๋ค. ๊ณต๊ฐ ๋ฆด๋ฆฌ์ค(Hugging Face์ 7B, Azure AI์ 7B)๋ ์ฐ๊ตฌ/๋น์์ ์ฉ ๋ผ์ด์ ์ค๋ฅผ ๋ฐ๋ฆ ๋๋ค. ์ฌ์ฐ๋์๋ผ๋น์์์์ ์์ ์ ์ฌ์ฉ ๋๋ ์ํฐํ๋ผ์ด์ฆ ๋ฐฐํฌ์ ๊ฒฝ์ฐ, HUMAIN/SDAIA์ ์ง์ ๋ฌธ์ํ์ญ์์ค. ALLaM 34B๋ ๊ตญ๊ฐ HUMAIN Chat ์ฑ์ ๊ตฌ๋ํ์ง๋ง ๊ณต๊ฐ ์ ๊ทผ์ด ์ ํ๋์ด ์์ต๋๋ค.
์๋์ด ํ ํฐํ๋ ๋ชจ๋ธ ํ์ง์ ์ด๋ค ์ํฅ์ ๋ฏธ์นฉ๋๊น?
์๋์ด ์คํฌ๋ฆฝํธ๋ ๋ฌธ์ ์์ค ์ค๋ฅ๋ฅผ ํผํ๊ธฐ ์ํด ์ ์ ํ ํ ํฐํ๊ฐ ํ์ํฉ๋๋ค. ์๋์ด๋ก ๋ค์ดํฐ๋ธ ํ๋ จ๋ ๋ชจ๋ธ(Jais, Falcon Arabic)์ ์๋์ด ํํ๋ก ์ ์ต์ ํ๋ ํ ํฌ๋์ด์ ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ผ๋ฐ ๋ค๊ตญ์ด ๋ชจ๋ธ์ ์๋์ด๋ฅผ ๋นํจ์จ์ ์ผ๋ก ํ ํฐํํ ์ ์์ด(์ด๊ทผ-ํจํด ํํ๋ก ๋ถํ ) ๋ณต์กํ ์๋์ด ํ ์คํธ์์ ํ์ง ์ ํ๋ฅผ ์ด๋ํฉ๋๋ค. ํ๋ก๋์ ๋ฐฐํฌ ์ ์ ์ค์ ์ ๋ ฅ ๋ฐ์ดํฐ๋ก ํ ์คํธํ์ญ์์ค.
์๋์ด ๋ก์ปฌ LLM์ด ์ค๋ฅธ์ชฝ์์ ์ผ์ชฝ(RTL) ๋ฌธ์๋ฅผ ์ฒ๋ฆฌํ ์ ์์ต๋๊น?
๋ชจ๋ธ์ ์ฌ๋ฐ๋ฅธ ์ค๋ฅธ์ชฝ์์ ์ผ์ชฝ ๋ฐฉํฅ์ผ๋ก ์๋์ด ํ ์คํธ๋ฅผ ์์ฑํฉ๋๋ค โ ์๋์ด๋ ์ ๋์ฝ๋์์ ์๋ฐฉํฅ์ด๋ฉฐ ๋ชจ๋ธ์ ์ ์ ํ RTL ์๋์ด๋ฅผ ์์ฑํฉ๋๋ค. ์ ํ๋ฆฌ์ผ์ด์ ์ธํฐํ์ด์ค๊ฐ RTL ๋ ๋๋ง(HTML dir="rtl", CSS direction:rtl)์ ์ฒ๋ฆฌํด์ผ ํฉ๋๋ค. llama.cpp, Ollama, vLLM์ ์ ๋์ฝ๋ ์๋์ด ํ ์คํธ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ๋ฐํํ๋ฉฐ; ๋ฐฉํฅ์ UI ๋ ์ด์ด๊ฐ ์ฒ๋ฆฌํฉ๋๋ค.
UAE ์ ๋ถ ๋ฐฐํฌ์ ๊ฐ์ฅ ์ ํฉํ ์๋์ด LLM์ ๋ฌด์์ ๋๊น?
Falcon Arabic 7B(TII, ์๋ถ๋ค๋น)์ Jais 30B(Core42/G42, ์๋ถ๋ค๋น)๋ ๋ชจ๋ UAE ์ ๋ถ ์ ํด ์ฐ๊ตฌ ๊ธฐ๊ด์์ ์ ๋ํ UAE ๋ค์ดํฐ๋ธ ๋ชจ๋ธ์ ๋๋ค. ์ฃผ๊ถ๊ณผ ๊ฐ์ฌ ๊ฐ๋ฅ์ฑ ์ธก๋ฉด์์ ๊ฐ์ฅ ๋ถํฉํ๋ ์ ํ์ ๋๋ค. ๋ ๋ค ๋ฐ์ดํฐ๊ฐ UAE ์ธํ๋ผ๋ฅผ ๋ฒ์ด๋์ง ์๊ณ ์จํ๋ ๋ฏธ์ค์ ๋ฐฐํฌํ ์ ์์ต๋๋ค. UAE PDPL ๋ฐ์ดํฐ ์ฃผ๊ถ ๊ฐ์ด๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
ํ๋กฌํํธ์์ ๊ฑธํ ์๋์ด ๋ฐฉ์ธ๊ณผ MSA๋ฅผ ์ด๋ป๊ฒ ์ฒ๋ฆฌํฉ๋๊น?
๊ธฐ๋ณธ ์์คํ ํ๋กฌํํธ: "ุฃุฌุจ ุจุงููุบุฉ ุงูุนุฑุจูุฉ ุงููุตุญู"(ํ๋ ํ์ค ์๋์ด๋ก ๋ตํ์ธ์). ๊ฑธํ ์๋์ด(์๋ฏธ๋ฆฌํธ, ์ฌ์ฐ๋, ์ฟ ์จ์ดํธ)์ ๊ฒฝ์ฐ, ์์คํ ํ๋กฌํํธ์ ์์ ๋ฐฉ์ธ ๊ตฌ๋ฌธ์ ์ถ๊ฐํ๊ฑฐ๋ ๋๋ฉ์ธ ๋ฐ์ดํฐ๋ก ๋ฏธ์ธ ์กฐ์ ํ์ญ์์ค. ๋์ด๋ ๋ชจ๋ ๋ชจ๋ธ์ด MSA๋ฅผ ์ ์ฒ๋ฆฌํฉ๋๋ค; ๋ฐฉ์ธ ํ์ง์ ๋ค์ํฉ๋๋ค. ํ๋ก๋์ ํ์ง์ ๊ฐ์ ํ๊ธฐ ์ ์ 5-10๊ฐ์ ์์ ๋ฐฉ์ธ ์ฟผ๋ฆฌ๋ก ๊ตฌ์ฒด์ ์ผ๋ก ํ ์คํธํ์ญ์์ค.
Jais ๋๋ Falcon Arabic์ ์์ฒด ์๋์ด ๋ฐ์ดํฐ๋ก ๋ฏธ์ธ ์กฐ์ ํ ์ ์์ต๋๊น?
์ โ ๋ ๋ค ๋ฏธ์ธ ์กฐ์ ์ ํ์ฉํ๋ ๊ณต๊ฐ ๋ผ์ด์ ์ค(Jais๋ Apache 2.0, Falcon Arabic์ Falcon LLM License)๋ฅผ ์ฌ์ฉํฉ๋๋ค. Unsloth ๋๋ PEFT ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๊ฐ์ ๋๊ตฌ๋ก LoRA ๋๋ QLoRA ๋ฏธ์ธ ์กฐ์ ์ ์ฌ์ฉํ์ญ์์ค. ๋๋ฉ์ธ๋ณ ์๋์ด ๋ฐ์ดํฐ(๋ฒ๋ฅ , ์๋ฃ, ๊ธ์ต)๋ก ๋ฏธ์ธ ์กฐ์ ํ๋ฉด ํนํ๋ ์ฌ์ฉ ์ฌ๋ก์ ํ์ง์ด ํฌ๊ฒ ํฅ์๋ฉ๋๋ค. PDPL ์ค์๋ฅผ ์ํด ๋ฏธ์ธ ์กฐ์ ๋ฐ์ดํฐ๋ฅผ ์จํ๋ ๋ฏธ์ค์ ์ ์งํ์ญ์์ค.
Jais 30B๋ฅผ ๋ก์ปฌ์์ ์คํํ๋ ค๋ฉด ์ด๋ค ํ๋์จ์ด๊ฐ ํ์ํฉ๋๊น?
Q4_K_M ์์ํ์์ Jais 30B๋ ์ถ์ 18-20 GB VRAM์ด ํ์ํฉ๋๋ค(์ถ์ ์น โ ๊ณต์ ๋ฒค์น๋งํฌ ์์). NVIDIA RTX 4090(24 GB)์ ์ ๋นํ ์ปจํ ์คํธ๋ก Q4์์ ์คํํ ์ ์์ผ๋ฉฐ; A100 40 GB์ FP16์์ ํธ์ํ๊ฒ ์ฒ๋ฆฌํฉ๋๋ค. ํ๋ก๋์ ์ฒ๋ฆฌ๋์ ๊ฒฝ์ฐ, ๋ฉํฐ GPU ๋ชจ๋์ ๋ ๊ฐ RTX 4090 ๋๋ ๋จ์ผ A100/H100์ด ๊ถ์ฅ๋ฉ๋๋ค. VRAM ๊ณ์ฐ๊ธฐ ๊ฐ์ด๋๋ฅผ ์ฐธ์กฐํ์ญ์์ค.
์ถ์ฒ
- Technology Innovation Institute (TII) โ Falcon 3 ๋ฐํ, December 17, 2024 โ tii.ae
- Falcon 3 Hugging Face ๋ชจ๋ธ ํ์ด์ง โ huggingface.co/tiiuae/Falcon3-7B-Instruct
- Core42 / Cerebras โ Jais 30B ๋ณด๋ ์๋ฃ โ cerebras.ai ๋ฐ g42.ai
- Jais 30B on Hugging Face โ huggingface.co/inceptionai/jais-30b-v3
- SDAIA / HUMAIN โ ALLaM 34B ๋ฐํ, May 2025 โ humain.ai
- ALLaM-2-7B on Microsoft Azure AI โ techcommunity.microsoft.com (September 2024)
- HELM Arabic โ Stanford CRFM, December 2025 โ crfm.stanford.edu/2025/12/18/helm-arabic.html
- Qwen3 Technical Report โ arxiv.org/abs/2505.09388
- ALUE Benchmark โ aclanthology.org/2021.wanlp-1.18
- TII Arabic LLM Benchmarks โ github.com/tiiuae/Arabic-LLM-Benchmarks