Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/ALLaM, AceGPT ๋ฐ ์ตœ๊ณ ์˜ ์‚ฌ์šฐ๋”” ์•„๋ž์–ด ๋กœ์ปฌ LLM (2026)
Best Models

ALLaM, AceGPT ๋ฐ ์ตœ๊ณ ์˜ ์‚ฌ์šฐ๋”” ์•„๋ž์–ด ๋กœ์ปฌ LLM (2026)

ยท11๋ถ„ ์ฝ๊ธฐยทBy Hans Kuepper ยท Founder of PromptQuorum, multi-model AI dispatch tool ยท PromptQuorum

์‚ฌ์šฐ๋””์•„๋ผ๋น„์•„์˜ ์•„๋ž์–ด ๋กœ์ปฌ AI๋ฅผ ์œ„ํ•ด์„œ๋Š” ALLaM 7B (HUMAIN/NCAI, Apache 2.0)๊ฐ€ ๊ณต๊ฐœ์ ์œผ๋กœ ์ด์šฉ ๊ฐ€๋Šฅํ•œ ์„ ๋„์  ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค โ€” AraLingBench์—์„œ 72โ€“74%๋ฅผ ๊ธฐ๋กํ•˜๋ฉฐ Qwen ๋ณ€ํ˜•์˜ 40โ€“62%๋ฅผ ๋Šฅ๊ฐ€ํ•˜๊ณ  โ€” GGUF ๊ฐ€์ค‘์น˜๋ฅผ ์‚ฌ์šฉํ•ด Ollama๋ฅผ ํ†ตํ•ด ๋กœ์ปฌ์—์„œ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. AceGPT 7B/13B (KAUST + CUHKSZ)๋Š” ๋Œ€์•ˆ์ด์ง€๋งŒ 2023๋…„ 12์›” ์ดํ›„๋กœ ์œ ์ง€ ๊ด€๋ฆฌ๋˜์ง€ ์•Š๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค.

HUMAIN์˜ ALLaM ๋ชจ๋ธ๊ณผ ๊ณต์‹์ ์ธ 2026๋…„ ์ธ๊ณต์ง€๋Šฅ์˜ ํ•ด๋ฅผ ํฌํ•จํ•œ ์‚ฌ์šฐ๋””์•„๋ผ๋น„์•„์˜ AI ์šฐ์„  ์•ผ๋ง์€ ์ƒˆ๋กœ์šด ์„ธ๋Œ€์˜ ์•„๋ž์–ด ๋„ค์ดํ‹ฐ๋ธŒ ๋กœ์ปฌ LLM์„ ๋งŒ๋“ค์–ด๋‚ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜ ์•„๋ž์–ด ์ž‘์—…์šฉ ๋ชจ๋ธ์„ ์„ ํƒํ•˜๋Š” ๊ฒƒ์€ ๋‹จ์ˆœํžˆ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜์˜ ๋ฌธ์ œ๊ฐ€ ์•„๋‹™๋‹ˆ๋‹ค. ๊ธ€๋กœ๋ฒŒ ๊ณต๊ธ‰์—…์ฒด์˜ ๋‹ค๊ตญ์–ด ๋ชจ๋ธ์€ ๋ฌธ๋ฒ•์ ์œผ๋กœ ์œ ์ฐฝํ•˜๋”๋ผ๋„ ๋ฌธํ™” ๋ฐ ๋ฐฉ์–ธ ์ž‘์—…์—์„œ ์•„๋ž์–ด ํŠนํ™” ๋ชจ๋ธ๋ณด๋‹ค ํ›จ์”ฌ ๋‚ฎ์€ ์ ์ˆ˜๋ฅผ ๋ฐ›์Šต๋‹ˆ๋‹ค. ์ด ๊ฐ€์ด๋“œ๋Š” ALLaM (HUMAIN/NCAI), AceGPT (KAUST + CUHKSZ), ๊ทธ๋ฆฌ๊ณ  ์ตœ๊ณ ์˜ ๋‹ค๊ตญ์–ด ๋Œ€์•ˆ์„ ๊ฒ€์ฆ๋œ ๋ฒค์น˜๋งˆํฌ ๋ฐ์ดํ„ฐ, VRAM ์š”๊ตฌ ์‚ฌํ•ญ, ๊ทธ๋ฆฌ๊ณ  Ollama๋กœ ALLaM์„ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•˜๋Š” ๋‹จ๊ณ„๋ณ„ ๊ฐ€์ด๋“œ์™€ ํ•จ๊ป˜ ๋‹ค๋ฃน๋‹ˆ๋‹ค.

Key Takeaways

  • ALLaM 7B๋Š” ๊ณต๊ฐœ์ ์œผ๋กœ ์ž์ฒด ํ˜ธ์ŠคํŒ… ๊ฐ€๋Šฅํ•œ ์ตœ๊ณ ์˜ ์•„๋ž์–ด ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค โ€” NCAI/SDAIA๊ฐ€ ๊ตฌ์ถ•ํ–ˆ๊ณ  (ํ˜„์žฌ HUMAIN ์‚ฐํ•˜), Apache 2.0์œผ๋กœ ์ถœ์‹œ๋˜์—ˆ์œผ๋ฉฐ, Ollama์™€ llama.cpp์—์„œ ์ง์ ‘ ์‹คํ–‰๋˜๋Š” GGUF ๊ฐ€์ค‘์น˜๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
  • ๋ฒค์น˜๋งˆํฌ ๊ฒฉ์ฐจ๋Š” ์‹ค์žฌํ•ฉ๋‹ˆ๋‹ค: ALLaM-7B๋Š” AraLingBench์—์„œ 72โ€“74%๋ฅผ ๊ธฐ๋กํ•˜๋Š” ๋ฐ˜๋ฉด Qwen ๋ณ€ํ˜•์€ 40โ€“62%๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค โ€” ์•„๋ž์–ด ์–ธ์–ด ์ž‘์—…์—์„œ 12โ€“32 ํผ์„ผํŠธ ํฌ์ธํŠธ์˜ ๊ฒฉ์ฐจ์ž…๋‹ˆ๋‹ค.
  • AceGPT (KAUST + CUHKSZ + SRIBD)๋Š” 7B/13B Apache 2.0 ๋Œ€์•ˆ์ด์ง€๋งŒ, ๋งˆ์ง€๋ง‰ GitHub ์—…๋ฐ์ดํŠธ๊ฐ€ 2023๋…„ 12์›”์ด์—ˆ์Šต๋‹ˆ๋‹ค โ€” ์œ ์ง€ ๊ด€๋ฆฌ๋˜์ง€ ์•Š๋Š” ๊ฒƒ์œผ๋กœ ๊ฐ„์ฃผํ•˜์‹ญ์‹œ์˜ค.
  • ๋ฌธํ™”์  ์ถฉ์‹ค๋„ โ‰  ๋ฌธ๋ฒ•์  ์œ ์ฐฝ์„ฑ. ๊ธ€๋กœ๋ฒŒํ•˜๊ฒŒ ํ•™์Šต๋œ ๋ชจ๋ธ์€ ๋ฌธ๋ฒ•์ ์œผ๋กœ ์ •ํ™•ํ•˜๋”๋ผ๋„ ๋ฌธํ™”์ ์œผ๋กœ ํ‹€๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๊ตญ์–ด ๋ชจ๋ธ์„ ์•„๋ž์–ด๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋ฉด ์ข…์ข… MSA ํ’ˆ์งˆ์€ *ํ–ฅ์ƒ*๋˜์ง€๋งŒ ๋ฐฉ์–ธ ์ •ํ™•๋„๋Š” *์ €ํ•˜*๋ฉ๋‹ˆ๋‹ค โ€” ๋ฌธ์„œํ™”๋œ ์—ญ์„ค์ž…๋‹ˆ๋‹ค.
  • VRAM ๋น ๋ฅธ ์ฐธ์กฐ (Q4_K_M): 7B โ‰ˆ 6โ€“8 GB, 13B โ‰ˆ 10โ€“14 GB, 34B โ‰ˆ 20โ€“24 GB, 70B โ‰ˆ 40โ€“48 GB.
  • ALLaM 34B๋Š” ๋…์ ์ž…๋‹ˆ๋‹ค โ€” HUMAIN Chat์„ ๊ตฌ๋™ํ•˜์ง€๋งŒ ๊ณต๊ฐœ ๊ฐ€์ค‘์น˜๊ฐ€ ์—†์œผ๋ฏ€๋กœ, ์˜ค๋Š˜๋‚  ์ž์ฒด ํ˜ธ์ŠคํŒ… ๊ฐ€๋Šฅํ•œ ๊ฒƒ์€ 7B๋ฟ์ž…๋‹ˆ๋‹ค.
  • ๊ตญ๊ฐ€์  ์ถ”์ง„๋ ฅ: ์‚ฌ์šฐ๋””์•„๋ผ๋น„์•„๋Š” 2026๋…„์„ ์ธ๊ณต์ง€๋Šฅ์˜ ํ•ด๋กœ ์„ ์–ธํ•˜์—ฌ ์•„๋ž์–ด ๋ชจ๋ธ ๊ฐœ๋ฐœ์„ ๊ฐ€์†ํ™”ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

ALLaM 7B (Apache 2.0, Ollama ์ง€์›)๋Š” ๊ณต๊ฐœ์ ์œผ๋กœ ์ž์ฒด ํ˜ธ์ŠคํŒ… ๊ฐ€๋Šฅํ•œ ์„ ๋„์  ์•„๋ž์–ด ๋ชจ๋ธ๋กœ, AraLingBench์—์„œ 72โ€“74%๋ฅผ ๊ธฐ๋กํ•˜๋ฉฐ Qwen ๋ณ€ํ˜•์˜ 40โ€“62%๋ฅผ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

์ž์ฒด ์ปดํ“จํ„ฐ์—์„œ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ๋Š” ์•„๋ž์–ด AI๊ฐ€ ํ•„์š”ํ•˜๋‹ค๋ฉด, ์‚ฌ์šฐ๋””์•„๋ผ๋น„์•„์˜ ALLaM 7B๊ฐ€ ํ˜„์žฌ ๊ฐ€์žฅ ์ข‹์€ ๋ฌด๋ฃŒ ์˜ต์…˜์ž…๋‹ˆ๋‹ค. Qwen ๊ฐ™์€ ๋Œ€ํ˜• ๊ธ€๋กœ๋ฒŒ ๋ชจ๋ธ์€ ์•„๋ž์–ด ๋ฌธ๋ฒ•์€ ์ดํ•ดํ•˜์ง€๋งŒ ๋ฌธํ™”์™€ ๋ฐฉ์–ธ์€ ์ž์ฃผ ๋†“์นฉ๋‹ˆ๋‹ค.

๋กœ์ปฌ AI์—์„œ ์•„๋ž์–ด ๋ฌธํ™”์  ์ถฉ์‹ค๋„๊ฐ€ ์ค‘์š”ํ•œ ์ด์œ 

๋ชจ๋ธ์€ ๋ฌธ๋ฒ•์ ์œผ๋กœ ์ •ํ™•ํ•œ ์•„๋ž์–ด๋ฅผ ์ƒ์„ฑํ•˜๋ฉด์„œ๋„ ์—ฌ์ „ํžˆ ๋ฌธํ™”์ ์œผ๋กœ ํ‹€๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค โ€” ๊ทธ๋ฆฌ๊ณ  ์‚ฌ์šฐ๋””์•„๋ผ๋น„์•„์˜ ๊ณ ๊ฐ ๋Œ€๋ฉด ๋˜๋Š” ์ •๋ถ€ ์—…๋ฌด์—์„œ๋Š” ๋ฌธํ™”์  ์ •ํ™•์„ฑ์ด ์ค‘์š”ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋ฒค์น˜๋งˆํฌ ์ฆ๊ฑฐ๋Š” ์ผ๊ด€๋ฉ๋‹ˆ๋‹ค. ์•„๋ž์–ด ํ˜•ํƒœ๋ก ์  ๋ฐ ํ†ต์‚ฌ๋ก ์  ์ถ”๋ก ์„ ํ…Œ์ŠคํŠธํ•˜๋Š” AraLingBench์—์„œ Qwen ๊ณ„์—ด ๋ชจ๋ธ์€ 40โ€“62%๋ฅผ ๊ธฐ๋กํ•˜๋Š” ๋ฐ˜๋ฉด ALLaM-7B ๊ฐ™์€ ์•„๋ž์–ด ํŠนํ™” ๋ชจ๋ธ์€ 72โ€“74%๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค. ๊ทธ 12โ€“32 ํผ์„ผํŠธ ํฌ์ธํŠธ์˜ ๊ฒฉ์ฐจ๋Š” ์ •ํ™•ํžˆ โ€” ํ˜•ํƒœ๋ก , ํ†ต์‚ฌ๋ก , ๊ฒฉ์‹ โ€” ์•„๋ž์–ด๊ฐ€ ๊ธ€๋กœ๋ฒŒ ๋ชจ๋ธ์ด ์ตœ์ ํ™”๋œ ์œ ๋Ÿฝ ์–ธ์–ด์™€ ๊ฐ€์žฅ ํฌ๊ฒŒ ๋‹ค๋ฅธ ์˜์—ญ์— ์ง‘์ค‘๋ฉ๋‹ˆ๋‹ค.

๋ฏธ์„ธ ์กฐ์ •์€ ๋ฌด๋ฃŒ ํ•ด๊ฒฐ์ฑ…์ด ์•„๋‹™๋‹ˆ๋‹ค. ์•„๋ž์–ด LLM ํ™˜๊ฒฝ์— ๋Œ€ํ•œ ์—ฐ๊ตฌ (arXiv 2506.01340, 2026)๋Š” ์—ญ์„ค์„ ๋ฌธ์„œํ™”ํ•ฉ๋‹ˆ๋‹ค: ๋‹ค๊ตญ์–ด ๋ชจ๋ธ์„ ์•„๋ž์–ด ๋ฐ์ดํ„ฐ๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋ฉด ์ข…์ข… ํ˜„๋Œ€ ํ‘œ์ค€ ์•„๋ž์–ด (MSA) ํ’ˆ์งˆ์€ ํ–ฅ์ƒ๋˜์ง€๋งŒ ๋ฐฉ์–ธ ์ •ํ™•๋„๋Š” *์ €ํ•˜*๋ฉ๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ ๊ธ€๋กœ๋ฒŒ ๋ชจ๋ธ์— ์•„๋ž์–ด ์—ญ๋Ÿ‰์„ ๋ง๋ถ™์—ฌ ๋ฐฉ์–ธ ์ถฉ์‹ค๋„๋ฅผ ๊ธฐ๋Œ€ํ•  ์ˆ˜๋Š” ์—†์Šต๋‹ˆ๋‹ค.

๋ฐฉ์–ธ ์ฒ˜๋ฆฌ๋Š” ๊ธ€๋กœ๋ฒŒ ๋ชจ๋ธ์ด ๊ฐ€์žฅ ๋ˆˆ์— ๋„๊ฒŒ ๋ฌด๋„ˆ์ง€๋Š” ์ง€์ ์ž…๋‹ˆ๋‹ค. ๋” ์ž‘์€ ์˜คํ”ˆ ์›จ์ดํŠธ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, ์—„๊ฒฉํ•œ ISO ์ฝ”๋“œ ๋ฐฉ์–ธ ์ •ํ™•๋„๊ฐ€ 0.016โ€“0.078๊นŒ์ง€ ๋‚ฎ๊ฒŒ ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค โ€” ์ฆ‰ ๋ชจ๋ธ์ด *์ž˜๋ชป๋œ* ๋ฐฉ์–ธ์œผ๋กœ ์œ ์ฐฝํ•œ ์•„๋ž์–ด๋ฅผ ์ƒ์„ฑํ•œ๋‹ค๋Š” ์˜๋ฏธ์ž…๋‹ˆ๋‹ค. AraDiCE ๋ฒค์น˜๋งˆํฌ (COLING 2025)๋Š” ์•„๋ž์–ด ํŠนํ™” ๋ชจ๋ธ์ด ๋ฐฉ์–ธ์—์„œ ๋‹ค๊ตญ์–ด ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ฐœ๊ฒฌํ•˜์ง€๋งŒ, ๋ฐฉ์–ธ ์‹๋ณ„ ๋ฐ ์ƒ์„ฑ์—์„œ์˜ ์ƒ๋‹นํ•œ ๊ณผ์ œ๋Š” ๋ชจ๋“  ๋ชจ๋ธ์— ๊ฑธ์ณ ์ง€์†๋ฉ๋‹ˆ๋‹ค.

๋ฌธํ™”์  ๋ฐ ์ข…๊ต์  ๋งฅ๋ฝ์€ ๋ฌธ์„œํ™”๋œ ์•ฝ์ ์ž…๋‹ˆ๋‹ค. ๊ฐ™์€ ์กฐ์‚ฌ๋Š” ์„œ๊ตฌ ์ค‘์‹ฌ์  ๋˜๋Š” ๋‹ค๊ตญ์–ด ํ•™์Šต ๋ฐ์ดํ„ฐ๊ฐ€ "๋ชจ๋ธ์„ ์•„๋ž์–ด ์‚ฌ์šฉ ์ปค๋ฎค๋‹ˆํ‹ฐ์˜ ๊ฐ€์น˜์™€ ๊ธฐ๋Œ€์™€ ์–ด๊ธ‹๋‚˜๊ฒŒ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋Š” ๋ฌธํ™”์  ํŽธํ–ฅ์„ ๋„์ž…ํ•œ๋‹ค"๊ณ  ์–ธ๊ธ‰ํ•ฉ๋‹ˆ๋‹ค โ€” ์ด๋Š” ๋ชจ๋ธ์ด ์ด์Šฌ๋žŒ ์ฃผ์ œ, ๊ฒฉ์‹ ์žˆ๋Š” ํ˜ธ์นญ, ๊ทธ๋ฆฌ๊ณ  ์‚ฌํšŒ์  ๊ด€์Šต์„ ์–ด๋–ป๊ฒŒ ๋‹ค๋ฃจ๋Š”์ง€์— ์˜ํ–ฅ์„ ๋ฏธ์นฉ๋‹ˆ๋‹ค.

๋ฌธ๋ฒ•์  ์„ฑ ์ผ์น˜๋Š” ์•Œ๋ ค์ง„, ์ง€์†์ ์ธ ๊ณผ์ œ์ž…๋‹ˆ๋‹ค: ์•„๋ž์–ด๋Š” ๋™์‚ฌ, ํ˜•์šฉ์‚ฌ, ๋Œ€๋ช…์‚ฌ์— ์œ ๋Ÿฝ ์–ธ์–ด์™€ ๊ตฌ์กฐ์ ์œผ๋กœ ๋‹ค๋ฅธ ๋ฐฉ์‹์œผ๋กœ ์„ฑ ์ผ์น˜๋ฅผ ์ ์šฉํ•˜๋ฉฐ, ๊ธ€๋กœ๋ฒŒํ•˜๊ฒŒ ํ•™์Šต๋œ ๋ชจ๋ธ์€ ์ด๋ฅผ ์ผ์ƒ์ ์œผ๋กœ ๋ฏธ๋ฌ˜ํ•˜๊ฒŒ ํ‹€๋ฆฝ๋‹ˆ๋‹ค.

์‚ฌ์šฐ๋”” ๋ฐฐํฌ์— ๋Œ€ํ•œ ๋น„์ฆˆ๋‹ˆ์Šค์  ํ•จ์˜: ์‚ฌ์šฉ ์‚ฌ๋ก€๊ฐ€ ๊ณ ๊ฐ ๋Œ€๋ฉด ์•„๋ž์–ด ์ฝ˜ํ…์ธ , ๊ฒฉ์‹ ์žˆ๋Š” ์„œ์‹ , ๋˜๋Š” ๋ฌธํ™”์ ์ด๊ฑฐ๋‚˜ ์ข…๊ต์ ์ธ ๋งฅ๋ฝ์— ๊ด€๋ จ๋œ ๋ฌด์—‡์ด๋“ ์ด๋ผ๋ฉด, ์•„๋ž์–ด ํŠนํ™” ๋ชจ๋ธ์€ ๊ทธ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„์˜ ๊ฐ€์น˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค โ€” ๊ทธ๋ฆฌ๊ณ  MSA ๋Œ€ ๊ฑธํ”„ ๋ฐฉ์–ธ์˜ ๊ตฌ๋ณ„์€ ๋ชจ๋ธ ์„ ํƒ์˜ ๋ช…์‹œ์ ์ธ ๋ถ€๋ถ„์ด ๋˜์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์‚ฌ์šฐ๋”” ๋ฐ ์•„๋ž์–ด ๋กœ์ปฌ ๋ชจ๋ธ: ALLaM, AceGPT, ๊ทธ๋ฆฌ๊ณ  ๋‹ค๊ตญ์–ด ๋Œ€์•ˆ

ALLaM 7B๋Š” ์ž์ฒด ํ˜ธ์ŠคํŒ… ์•„๋ž์–ด AI๋ฅผ ์œ„ํ•œ ๊ถŒ์žฅ ์‹œ์ž‘์ ์ž…๋‹ˆ๋‹ค. ์•„๋ž˜ ํ‘œ๋Š” ํ˜„์‹ค์ ์ธ ์˜ต์…˜์„ ์š”์•ฝํ•ฉ๋‹ˆ๋‹ค.

ALLaM์€ SDAIA์˜ ๊ตญ๊ฐ€ AI ์„ผํ„ฐ (NCAI)๊ฐ€ IBM๊ณผ ํ˜‘๋ ฅํ•˜์—ฌ ๊ตฌ์ถ•ํ–ˆ์œผ๋ฉฐ, ํ˜„์žฌ๋Š” 2025๋…„ 5์›”์— ์ถœ๋ฒ”ํ•œ Public Investment Fund ์†Œ์œ ์˜ AI ํšŒ์‚ฌ์ธ HUMAIN์„ ํ†ตํ•ด ์ƒ์šฉํ™”๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ์ œํ’ˆ๊ตฐ์€ 7B, 13B, 34B, 70B ๋ณ€ํ˜•์— ๊ฑธ์ณ ์žˆ์ง€๋งŒ, 7B Instruct๋งŒ ๊ณต๊ฐœ์ ์œผ๋กœ ์ด์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค (Apache 2.0, Hugging Face์˜ 9๊ฐœ GGUF ์–‘์žํ™” ํฌํ•จ). HUMAIN Chat์„ ๊ตฌ๋™ํ•˜๋Š” 34B๋Š” ๊ณต๊ฐœ ๊ฐ€์ค‘์น˜๊ฐ€ ์—†๋Š” ๋…์ ์ž…๋‹ˆ๋‹ค.

AceGPT๋Š” KAUST, ํ™์ฝฉ์ค‘๋ฌธ๋Œ€ํ•™๊ต ์„ ์ „ (CUHKSZ), ๊ทธ๋ฆฌ๊ณ  ์„ ์ „ ๋น…๋ฐ์ดํ„ฐ ์—ฐ๊ตฌ์†Œ (SRIBD)์˜ ๊ณต๋™ ํ”„๋กœ์ ํŠธ์ž…๋‹ˆ๋‹ค โ€” KAUST ๋‹จ๋… ๋ชจ๋ธ์ด ์•„๋‹™๋‹ˆ๋‹ค. LLaMA-2๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๊ตฌ์ถ•๋œ 7B ๋ฐ 13B ๋ณ€ํ˜• (base ๋ฐ chat)์„ Apache 2.0์œผ๋กœ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. 2023๋…„ ์ถœ์‹œ ๋‹น์‹œ ์•„๋ž์–ด ์ž‘์—…์—์„œ Jais๋ฅผ ๋Šฅ๊ฐ€ํ–ˆ์ง€๋งŒ, ๋งˆ์ง€๋ง‰ GitHub ์—…๋ฐ์ดํŠธ๊ฐ€ 2023๋…„ 12์›”์ด์—ˆ์œผ๋ฏ€๋กœ ์œ ์ง€ ๊ด€๋ฆฌ๋˜์ง€ ์•Š๋Š” ๊ฒƒ์œผ๋กœ ๊ฐ„์ฃผํ•˜์‹ญ์‹œ์˜ค.

Qwen2.5๋Š” ๊ด‘๋ฒ”์œ„ํ•œ ์–ธ์–ด ์ปค๋ฒ„๋ฆฌ์ง€๋ฅผ ์œ„ํ•œ ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ๋‹ค๊ตญ์–ด ๋Œ€์•ˆ์ด์ง€๋งŒ, ๋ฒค์น˜๋งˆํฌ๊ฐ€ ๋ณด์—ฌ์ฃผ๋“ฏ์ด ๋” ํฐ ์ƒํƒœ๊ณ„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ๋ฌธํ™” ๋ฐ ๋ฐฉ์–ธ ์ž‘์—…์—์„œ๋Š” ์•„๋ž์–ด ํŠนํ™” ๋ชจ๋ธ์— ๋’ค์ฒ˜์ง‘๋‹ˆ๋‹ค.

Jais (13B/70B)๋Š” ์™„์ „์„ฑ์„ ์œ„ํ•ด ํฌํ•จ๋˜์—ˆ์ง€๋งŒ, UAE ์ถœ์‹  (Core42/G42, ์•„๋ถ€๋‹ค๋น„)์ด๋ฉฐ ์‚ฌ์šฐ๋””๊ฐ€ ์•„๋‹ˆ๋ผ๋Š” ์ ์— ์œ ์˜ํ•˜์‹ญ์‹œ์˜ค. ์•„๋ž์–ด ๋ฐฉ์–ธ ์ž‘์—…์—์„œ ๊ฒฝ์Ÿ๋ ฅ์„ ์œ ์ง€ํ•˜๋ฉฐ Apache 2.0์ž…๋‹ˆ๋‹ค.

๋ชจ๋ธํŒŒ๋ผ๋ฏธํ„ฐVRAM (Q4_K_M)๋ผ์ด์„ ์ŠคOllama์•„๋ž์–ด ์ ์ˆ˜
ALLaM 7B7B6โ€“8 GBApache 2.0์˜ˆ (GGUF)72โ€“74% (AraLingBench)
ALLaM 34B34B~20 GB๋…์ ์•„๋‹ˆ์š” (๊ณต๊ฐœ ๊ฐ€์ค‘์น˜ ์—†์Œ)๊ณต๊ฐœ ๋ฒค์น˜๋งˆํฌ ์—†์Œ
AceGPT 7B7B6โ€“8 GBApache 2.0์ปค๋ฎค๋‹ˆํ‹ฐ ํฌํŒ…์ถœ์‹œ ๋‹น์‹œ ๊ฐ•๋ ฅํ•จ (2023)
AceGPT 13B13B10โ€“14 GBApache 2.0์ปค๋ฎค๋‹ˆํ‹ฐ ํฌํŒ…์ถœ์‹œ ๋‹น์‹œ ๊ฐ•๋ ฅํ•จ (2023)
Qwen2.5 7B7B6โ€“8 GBApache 2.0์˜ˆ40โ€“62% (AraLingBench)
Qwen2.5 72B72B40โ€“48 GBApache 2.0์˜ˆ๋” ๋†’์ง€๋งŒ ๋ฌธํ™”์  ๊ฒฉ์ฐจ๋Š” ๋‚จ์•„ ์žˆ์Œ
Jais 13B (UAE)13B10โ€“14 GBApache 2.0์ œํ•œ์ ๋ฐฉ์–ธ์—์„œ ๊ฒฝ์Ÿ๋ ฅ ์žˆ์Œ

Ollama๋กœ ALLaM 7B ๋กœ์ปฌ ์‹คํ–‰ํ•˜๊ธฐ

ALLaM 7B๋Š” Hugging Face์—์„œ GGUF ์–‘์žํ™”๋กœ ์ œ๊ณต๋˜๋ฏ€๋กœ, ํ•œ ์ค„์งœ๋ฆฌ Modelfile๋กœ Ollama์—์„œ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์Œ ๋‹จ๊ณ„๋ฅผ ๋”ฐ๋ฅด์‹ญ์‹œ์˜ค.

  • ๋Œ€์•ˆ โ€” llama.cpp ์ง์ ‘ ์‚ฌ์šฉ: llama-cli -m ALLaM-7B-Instruct-Q4_K_M.gguf --chat-template chatml -p "ุฃูƒู…ู„ ุงู„ุฌู…ู„ุฉ ุงู„ุชุงู„ูŠุฉ:" ๋กœ ์ปจํ…์ŠคํŠธ ๊ธธ์ด์™€ ์ƒ˜ํ”Œ๋ง์„ ์ตœ๋Œ€ํ•œ ์ œ์–ดํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ปค๋ฎค๋‹ˆํ‹ฐ ํฌํŒ…์„ ํ†ตํ•œ AceGPT: ollama run salmatrafi/acegpt ๋Š” ๋น„๊ตํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด ์ปค๋ฎค๋‹ˆํ‹ฐ๊ฐ€ ์œ ์ง€ ๊ด€๋ฆฌํ•˜๋Š” AceGPT ํฌํŒ…์„ ๊ฐ€์ ธ์˜ต๋‹ˆ๋‹ค.
  • ์ตœ์†Œ ํ•˜๋“œ์›จ์–ด: 8 GB VRAM GPU (RTX 3070/4060 ์ด์ƒ) ๋˜๋Š” 16 GB ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ๊ฐ–์ถ˜ Apple Silicon. ๋” ํฐ ๋ชจ๋ธ์˜ ํฌ๊ธฐ๋Š” VRAM ๊ณ„์‚ฐ๊ธฐ๋กœ ์ธก์ •ํ•˜์‹ญ์‹œ์˜ค.
  1. 1
    Hugging Face์—์„œ GGUF ๋‹ค์šด๋กœ๋“œ
    Why it matters: Hugging Face์—์„œ humain-ai/ALLaM-7B-Instruct-preview๋ฅผ ๋ฐฉ๋ฌธํ•˜์—ฌ ์–‘์žํ™”๋ฅผ ๋‘˜๋Ÿฌ๋ณด๊ณ  ALLaM-7B-Instruct-Q4_K_M.gguf (๊ถŒ์žฅ, ~4.5 GB)๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค โ€” 8 GB GPU์— ๊ฐ€์žฅ ์ข‹์€ ํ’ˆ์งˆ ๋Œ€ ํฌ๊ธฐ ๊ท ํ˜•์ž…๋‹ˆ๋‹ค.
  2. 2
    Ollama ์„ค์น˜
    Why it matters: ์‚ฌ์šฉ ์ค‘์ธ OS์— ๋งž๊ฒŒ ollama.com์—์„œ Ollama๋ฅผ ๋‹ค์šด๋กœ๋“œํ•˜์‹ญ์‹œ์˜ค. 7B ๋ชจ๋ธ์„ ํŽธ์•ˆํ•˜๊ฒŒ ์‹คํ–‰ํ•˜๋ ค๋ฉด NVIDIA GPU์˜ VRAM ์•ฝ 8 GB, ๋˜๋Š” Apple Silicon์˜ ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ 16 GB๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
  3. 3
    Modelfile ์ƒ์„ฑ
    Why it matters: Modelfile์ด๋ผ๋Š” ์ด๋ฆ„์˜ ์ผ๋ฐ˜ ํ…์ŠคํŠธ ํŒŒ์ผ์„ ํ•œ ์ค„๋กœ ์ƒ์„ฑํ•˜์‹ญ์‹œ์˜ค: FROM ./ALLaM-7B-Instruct-Q4_K_M.gguf โ€” ์ด๋Š” Ollama์—๊ฒŒ ๊ฐ€์ค‘์น˜๋ฅผ ์–ด๋””์„œ ์ฐพ์„์ง€ ์•Œ๋ ค์ค๋‹ˆ๋‹ค.
  4. 4
    Ollama์— ๋ชจ๋ธ ๋“ฑ๋ก
    Why it matters: ์‹คํ–‰: ollama create allam-7b -f Modelfile. Ollama๊ฐ€ GGUF๋ฅผ ๊ฐ€์ ธ์™€์„œ ๋ฐ˜๋ณต์ ์œผ๋กœ ํ˜ธ์ถœํ•  ์ˆ˜ ์žˆ๋Š” ๋ช…๋ช…๋œ ๋ชจ๋ธ๋กœ ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•˜๊ฒŒ ๋งŒ๋“ญ๋‹ˆ๋‹ค.
  5. 5
    ์•„๋ž์–ด๋กœ ์ถ”๋ก  ์‹คํ–‰
    Why it matters: ์‹คํ–‰: ollama run allam-7b "ุงุดุฑุญ ู…ูู‡ูˆู… ุงู„ุฐูƒุงุก ุงู„ุงุตุทู†ุงุนูŠ ุงู„ู…ุญู„ูŠ" (๋กœ์ปฌ AI ๊ฐœ๋…์„ ์„ค๋ช…ํ•˜์‹ญ์‹œ์˜ค). ๋ชจ๋ธ์€ ํ˜„๋Œ€ ํ‘œ์ค€ ์•„๋ž์–ด๋กœ ์‘๋‹ตํ•ฉ๋‹ˆ๋‹ค.
  6. 6
    ์•„๋ž์–ด ์ถœ๋ ฅ ๊ฒ€์ฆ ๋ฐ ์กฐ์ •
    Why it matters: ๋ชจ๋ธ์ด ์˜์–ด๋กœ ์‘๋‹ตํ•˜๋ฉด, "ุฃุฌุจ ุฏุงุฆู…ุงู‹ ุจุงู„ู„ุบุฉ ุงู„ุนุฑุจูŠุฉ ุงู„ูุตุญู‰" (ํ•ญ์ƒ ํ˜„๋Œ€ ํ‘œ์ค€ ์•„๋ž์–ด๋กœ ์‘๋‹ตํ•˜์‹ญ์‹œ์˜ค)์™€ ๊ฐ™์€ ์‹œ์Šคํ…œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ๊ฒฉ์‹๊ณผ ์–ธ์–ด๋ฅผ ๊ณ ์ •ํ•˜์‹ญ์‹œ์˜ค.

์•„๋ž์–ด ๋ชจ๋ธ ํ’ˆ์งˆ์„ ์ง์ ‘ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐฉ๋ฒ•

๋ฒค์น˜๋งˆํฌ๋Š” ์‹œ์ž‘์ ์ด์ง€๋งŒ, ๋ฐฐํฌํ•˜๊ธฐ ์ „์— ์–ด๋–ค ์•„๋ž์–ด ๋ชจ๋ธ์ด๋“  ์ž์ฒด ๋„๋ฉ”์ธ์— ๋Œ€ํ•ด ํ…Œ์ŠคํŠธํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋‹ค์Œ ๊ฒ€์‚ฌ๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.

  • MSA ๋Œ€ ๋ฐฉ์–ธ ์ผ๊ด€์„ฑ: ๋™์ผํ•œ ํ”„๋กฌํ”„ํŠธ๋ฅผ ํ˜„๋Œ€ ํ‘œ์ค€ ์•„๋ž์–ด์™€ ๊ฑธํ”„ ๋ฐฉ์–ธ์œผ๋กœ ๋ณด๋‚ด๊ณ , ๋ชจ๋ธ์ด ๋‘˜ ๋ชจ๋‘์—์„œ ๊ฒฉ์‹๊ณผ ์˜๋ฏธ๋ฅผ ์œ ์ง€ํ•˜๋Š”์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.
  • ๋ฌธํ™”์  ๋งฅ๋ฝ ํ…Œ์ŠคํŠธ: ์‚ฌ์šฐ๋”” ๋ฌธํ™” ๊ด€ํ–‰, ์ด์Šฌ๋žŒ ๊ธˆ์œต ์›์น™, ๋˜๋Š” ๊ฒฉ์‹ ์žˆ๋Š” ํ˜ธ์นญ ๊ด€์Šต์— ๋Œ€ํ•ด ๋ฌผ์–ด๋ณด๊ณ  โ€” ๋‹จ์ง€ ๋ฌธ๋ฒ•์ ์œผ๋กœ ์œ ํšจํ•œ์ง€๊ฐ€ ์•„๋‹ˆ๋ผ ๊ทธ ํ‘œํ˜„์ด ์ ์ ˆํ•œ์ง€ ํ™•์ธํ•˜์‹ญ์‹œ์˜ค.
  • ์„ฑ ์ผ์น˜ ํ…Œ์ŠคํŠธ: ๋ชจ๋ธ์—๊ฒŒ ์—ฌ์„ฑ ์˜์‚ฌ์™€ ๋‚จ์„ฑ ์—”์ง€๋‹ˆ์–ด๋ฅผ ๋ฌ˜์‚ฌํ•˜๋„๋ก ์š”์ฒญํ•˜๊ณ , ๋™์‚ฌ, ํ˜•์šฉ์‚ฌ, ๋Œ€๋ช…์‚ฌ์—์„œ ์˜ฌ๋ฐ”๋ฅธ ์•„๋ž์–ด ๋ฌธ๋ฒ•์  ์„ฑ ์ผ์น˜๋ฅผ ๊ฒ€์ฆํ•˜์‹ญ์‹œ์˜ค.
  • ๊ฒฉ์‹ ๋ณด์ •: ๊ฒฉ์‹ ์žˆ๋Š” ํŽธ์ง€๋ฅผ ์š”์ฒญํ•œ ๋‹ค์Œ ์บ์ฃผ์–ผํ•œ ๋ฉ”์‹œ์ง€๋ฅผ ์š”์ฒญํ•˜์‹ญ์‹œ์˜ค โ€” ์ข‹์€ ๋ชจ๋ธ์€ ๊ฒฉ์‹์„ ์กฐ์ •ํ•˜๊ณ , ์•ฝํ•œ ๋ชจ๋ธ์€ ๋‘˜ ๋‹ค์— ๊ฐ™์€ ์–ด์กฐ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
  • ๋ฒค์น˜๋งˆํฌ ํ”„๋ก์‹œ: ๋ชจ๋ธ์„ ๋น„๊ตํ•  ๋•Œ AraLingBench (ํ˜•ํƒœ๋ก ์  ๋ฐ ํ†ต์‚ฌ๋ก ์  ์ถ”๋ก )์™€ AraDiCE (๋ฌธํ™”์  ์ธ์‹ ๋ฐ ๋ฐฉ์–ธ)๋ฅผ ๊ฒŒ์‹œ๋œ ์ฐธ์กฐ ์ง€์ ์œผ๋กœ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค.
  • ์œ„ํ—˜ ์‹ ํ˜ธ: ์•„๋ž์–ด ํ”„๋กฌํ”„ํŠธ์— ๋Œ€ํ•œ ๋ผํ‹ด ๋ฌธ์ž ์‘๋‹ต, ์ž˜๋ชป๋œ ๋ฐฉ์–ธ ๊ฒฉ์‹, ๋˜๋Š” ์ข…๊ต ์ฃผ์ œ์˜ ๋ฌธํ™”์ ์œผ๋กœ ๋ถ€์ ์ ˆํ•œ ํ‘œํ˜„์€ ๋ชจ๋‘ ๋ถ€์ ํ•ฉ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.
  • ์‹ค์šฉ์  ๊ทœ์น™: ๊ณ ๊ฐ ๋Œ€๋ฉด ์•„๋ž์–ด ์‚ฌ์šฉ ์‚ฌ๋ก€์˜ ๊ฒฝ์šฐ, ๋ฐฐํฌํ•˜๊ธฐ ์ „์— ์ตœ์†Œ 20๊ฐœ์˜ ๋„๋ฉ”์ธ๋ณ„ ํ”„๋กฌํ”„ํŠธ๋กœ ํ…Œ์ŠคํŠธํ•˜์‹ญ์‹œ์˜ค โ€” ๋ฒค์น˜๋งˆํฌ ์ ์ˆ˜๋Š” ๊ท€ํ•˜์˜ ํŠน์ • ์ฝ˜ํ…์ธ ๋ฅผ ํฌ์ฐฉํ•˜์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค.

์ž์ฃผ ๋ฌป๋Š” ์งˆ๋ฌธ: ์•„๋ž์–ด ๋กœ์ปฌ LLM

ALLaM์ด๋ž€ ๋ฌด์—‡์ด๋ฉฐ ๋ˆ„๊ฐ€ ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๊นŒ?

ALLaM์€ SDAIA์˜ ๊ตญ๊ฐ€ AI ์„ผํ„ฐ (NCAI)๊ฐ€ IBM๊ณผ ํ˜‘๋ ฅํ•˜์—ฌ ๊ตฌ์ถ•ํ•œ ์•„๋ž์–ด ์–ธ์–ด ๋ชจ๋ธ ์ œํ’ˆ๊ตฐ์ด๋ฉฐ, ํ˜„์žฌ๋Š” Public Investment Fund ์†Œ์œ ์˜ AI ํšŒ์‚ฌ์ธ HUMAIN์„ ํ†ตํ•ด ์ƒ์šฉํ™”๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. 7B Instruct ๋ฒ„์ „์€ Apache 2.0์œผ๋กœ ๊ณต๊ฐœ์ ์œผ๋กœ ์ด์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋” ํฐ 13B, 34B, 70B ๋ณ€ํ˜•์ด ์กด์žฌํ•˜์ง€๋งŒ, 7B๋งŒ ์˜คํ”ˆ ์›จ์ดํŠธ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

ALLaM์„ ๋กœ์ปฌ์—์„œ ์‹คํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์˜ˆ โ€” ALLaM 7B Instruct ๋ชจ๋ธ์€ Hugging Face์— GGUF ์–‘์žํ™”๊ฐ€ ์žˆ์–ด VRAM ์•ฝ 8 GB๋ฅผ ๊ฐ–์ถ˜ GPU ๋˜๋Š” 16 GB ํ†ตํ•ฉ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ๊ฐ–์ถ˜ Apple Silicon์—์„œ Ollama์™€ llama.cpp๋กœ ์ง์ ‘ ์‹คํ–‰๋ฉ๋‹ˆ๋‹ค. HUMAIN Chat์„ ๊ตฌ๋™ํ•˜๋Š” 34B๋Š” ๋…์ ์ด๋ฉฐ ์ž์ฒด ํ˜ธ์ŠคํŒ…ํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.

AceGPT๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์—ฌ์ „ํžˆ ์œ ์ง€ ๊ด€๋ฆฌ๋ฉ๋‹ˆ๊นŒ?

AceGPT๋Š” KAUST, CUHKSZ, ๊ทธ๋ฆฌ๊ณ  SRIBD๊ฐ€ ๊ณต๋™ ๊ฐœ๋ฐœํ•œ ์•„๋ž์–ด ๋ชจ๋ธ๋กœ, Apache 2.0์œผ๋กœ 7B ๋ฐ 13B ๋ณ€ํ˜•์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. 2023๋…„ ์ถœ์‹œ ๋‹น์‹œ Jais๋ฅผ ๋Šฅ๊ฐ€ํ–ˆ์ง€๋งŒ, ๋งˆ์ง€๋ง‰ GitHub ์—…๋ฐ์ดํŠธ๊ฐ€ 2023๋…„ 12์›”์ด์—ˆ์œผ๋ฏ€๋กœ ์œ ์ง€ ๊ด€๋ฆฌ๋˜์ง€ ์•Š๋Š” ๊ฒƒ์œผ๋กœ ๋ณด์ž…๋‹ˆ๋‹ค โ€” ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•˜์ง€๋งŒ ์ ๊ทน์ ์œผ๋กœ ๊ฐœ์„ ๋˜์ง€๋Š” ์•Š์Šต๋‹ˆ๋‹ค.

ALLaM์€ ์•„๋ž์–ด์—์„œ Qwen๊ณผ ์–ด๋–ป๊ฒŒ ๋น„๊ต๋ฉ๋‹ˆ๊นŒ?

AraLingBench์—์„œ ALLaM-7B๋Š” 72โ€“74%๋ฅผ ๊ธฐ๋กํ•˜๋Š” ๋ฐ˜๋ฉด Qwen ๋ณ€ํ˜•์€ 40โ€“62%๋ฅผ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค โ€” ์•„๋ž์–ด ์–ธ์–ด ์ž‘์—…์—์„œ 12โ€“32 ํผ์„ผํŠธ ํฌ์ธํŠธ์˜ ๊ฒฉ์ฐจ์ž…๋‹ˆ๋‹ค. Qwen์€ ๋” ํฐ ์ƒํƒœ๊ณ„์™€ ๋” ๊ด‘๋ฒ”์œ„ํ•œ ๋‹ค๊ตญ์–ด ์ปค๋ฒ„๋ฆฌ์ง€๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ์ง€๋งŒ, ALLaM์€ ์•„๋ž์–ด ํŠนํ™” ํ˜•ํƒœ๋ก , ํ†ต์‚ฌ๋ก , ๊ทธ๋ฆฌ๊ณ  ๋ฌธํ™”์  ์ž‘์—…์—์„œ ๋” ๊ฐ•ํ•ฉ๋‹ˆ๋‹ค.

๋‹ค๊ตญ์–ด ๋ชจ๋ธ์ด ์•„๋ž์–ด์—์„œ ์–ด๋ ค์›€์„ ๊ฒช๋Š” ์ด์œ ๋Š” ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

์ผ๋ฐ˜์ ์œผ๋กœ ๋ฌธ๋ฒ•์ ์œผ๋กœ ์œ ์ฐฝํ•˜์ง€๋งŒ ๋ฌธํ™”์ ์œผ๋กœ ๊ทธ๋ฆฌ๊ณ  ๋ฐฉ์–ธ์ ์œผ๋กœ ์•ฝํ•ฉ๋‹ˆ๋‹ค. ์—„๊ฒฉํ•œ ๋ฐฉ์–ธ ์ •ํ™•๋„๋Š” ๋” ์ž‘์€ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ 0.016โ€“0.078๊นŒ์ง€ ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋‹ค๊ตญ์–ด ๋ชจ๋ธ์„ ์•„๋ž์–ด๋กœ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋ฉด ์ข…์ข… MSA ํ’ˆ์งˆ์€ ํ–ฅ์ƒ๋˜์ง€๋งŒ ๋ฐฉ์–ธ ์ •ํ™•๋„๋Š” ์ €ํ•˜๋ฉ๋‹ˆ๋‹ค โ€” ๋ฌธ์„œํ™”๋œ ์—ญ์„ค์ž…๋‹ˆ๋‹ค. ์„œ๊ตฌ ์ค‘์‹ฌ์  ํ•™์Šต ๋ฐ์ดํ„ฐ๋Š” ๋˜ํ•œ ๋ชจ๋ธ์ด ์ด์Šฌ๋žŒ ๋ฐ ์‚ฌํšŒ์  ๋งฅ๋ฝ์„ ๋‹ค๋ฃจ๋Š” ๋ฐฉ์‹์— ๋ฌธํ™”์  ํŽธํ–ฅ์„ ๋„์ž…ํ•ฉ๋‹ˆ๋‹ค.

7B ์•„๋ž์–ด ๋ชจ๋ธ์—๋Š” ์–ด๋–ค VRAM์ด ํ•„์š”ํ•ฉ๋‹ˆ๊นŒ?

Q4_K_M ์–‘์žํ™”์—์„œ VRAM ์•ฝ 6โ€“8 GB๊ฐ€ ํ•„์š”ํ•˜๋ฉฐ, ํŽธ์•ˆํ•œ ์„ฑ๋Šฅ์„ ์œ„ํ•ด์„œ๋Š” 8 GB ์ด์ƒ์„ ๊ถŒ์žฅํ•ฉ๋‹ˆ๋‹ค. 13B ๋ชจ๋ธ์€ 10โ€“14 GB, 34B๋Š” ์•ฝ 20โ€“24 GB, 70B๋Š” ์•ฝ 40โ€“48 GB๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

Jais๋Š” ์‚ฌ์šฐ๋”” ๋ชจ๋ธ์ž…๋‹ˆ๊นŒ?

์•„๋‹ˆ์š” โ€” Jais๋Š” UAE ์ถœ์‹ ์œผ๋กœ, ์‚ฌ์šฐ๋”” ๊ธฐ๊ด€์ด ์•„๋‹ˆ๋ผ ์•„๋ถ€๋‹ค๋น„์˜ Core42/G42๊ฐ€ ๊ฐœ๋ฐœํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฐฉ์–ธ ์ž‘์—…์—์„œ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์œ ๋Šฅํ•œ Apache 2.0 ์•„๋ž์–ด ๋ชจ๋ธ์ด๊ธฐ ๋•Œ๋ฌธ์— ์—ฌ๊ธฐ์— ํฌํ•จ๋˜์—ˆ์ง€๋งŒ, ์‚ฌ์šฐ๋”” (ALLaM/AceGPT) ๊ณ„๋ณด์˜ ์ผ๋ถ€๋Š” ์•„๋‹™๋‹ˆ๋‹ค.

ALLaM 34B๋ฅผ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๊นŒ ์•„๋‹ˆ๋ฉด 7B๋ฅผ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๊นŒ?

๋กœ์ปฌ ๋ฐฐํฌ์˜ ๊ฒฝ์šฐ 7B๋ฅผ ์‚ฌ์šฉํ•˜์‹ญ์‹œ์˜ค โ€” 34B๋Š” ๋…์ ์ด๋ฉฐ ์ž์ฒด ํ˜ธ์ŠคํŒ…ํ•  ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค. ์ž์ฒด ํ•˜๋“œ์›จ์–ด์—์„œ ALLaM 7B๋กœ ์‹œ์ž‘ํ•˜๊ณ , 34B ์—ญ๋Ÿ‰์ด ํ•„์š”ํ•˜๋‹ค๋ฉด ๋‹ค์šด๋กœ๋“œ ๊ฐ€๋Šฅํ•œ ๊ฐ€์ค‘์น˜๋ฅผ ๊ธฐ๋Œ€ํ•˜๊ธฐ๋ณด๋‹ค๋Š” HUMAIN Chat ์ œํ’ˆ์„ ํ†ตํ•ด ์ ‘๊ทผํ•˜์‹ญ์‹œ์˜ค.

๋ชจ๋ธ์ด ์‚ฌ์šฐ๋”” ์•„๋ž์–ด๋ฅผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์ฒ˜๋ฆฌํ•˜๋Š”์ง€ ์–ด๋–ป๊ฒŒ ํ…Œ์ŠคํŠธํ•ฉ๋‹ˆ๊นŒ?

MSA ๋Œ€ ๋ฐฉ์–ธ ์ผ๊ด€์„ฑ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์‹คํ–‰ํ•˜๊ณ , ์‚ฌ์šฐ๋”” ๋ฌธํ™” ๊ด€ํ–‰๊ณผ ์ด์Šฌ๋žŒ ๊ธˆ์œต์— ๋Œ€ํ•ด ๋ฌผ์–ด๋ณด๊ณ , ๋ฌธ๋ฒ•์  ์„ฑ ์ผ์น˜๋ฅผ ํ…Œ์ŠคํŠธํ•˜์‹ญ์‹œ์˜ค (์˜ˆ: ์—ฌ์„ฑ ์˜์‚ฌ์™€ ๋‚จ์„ฑ ์—”์ง€๋‹ˆ์–ด ๋ฌ˜์‚ฌ). ๋ผํ‹ด ๋ฌธ์ž ์‘๋‹ต, ์ž˜๋ชป๋œ ๋ฐฉ์–ธ ๊ฒฉ์‹, ๋˜๋Š” ๋ฌธํ™”์ ์œผ๋กœ ๋ถ€์ ์ ˆํ•œ ํ‘œํ˜„์„ ์ฃผ์˜ํ•˜๊ณ , ๋ฐฐํฌํ•˜๊ธฐ ์ „์— ์ตœ์†Œ 20๊ฐœ์˜ ๋„๋ฉ”์ธ๋ณ„ ํ”„๋กฌํ”„ํŠธ๋กœ ๊ฒ€์ฆํ•˜์‹ญ์‹œ์˜ค.

HUMAIN์ด๋ž€ ๋ฌด์—‡์ž…๋‹ˆ๊นŒ?

HUMAIN์€ Public Investment Fund๊ฐ€ ์ „์•ก ์†Œ์œ ํ•œ ์‚ฌ์šฐ๋””์•„๋ผ๋น„์•„ AI ๊ธฐ์—…์œผ๋กœ 2025๋…„ 5์›”์— ์„ค๋ฆฝ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ALLaM์„ ์ƒ์šฉํ™”ํ•˜๊ณ  HUMAIN Chat์„ ์šด์˜ํ•ฉ๋‹ˆ๋‹ค. SDAIA์™€๋Š” ๋ณ„๊ฐœ ์กฐ์ง์ด์ง€๋งŒ SDAIA์˜ ๊ตญ๋ฆฝ AI ์„ผํ„ฐ(NCAI)์—์„œ ALLaM ๋ชจ๋ธ์„ ์ธ๊ณ„๋ฐ›์•˜์Šต๋‹ˆ๋‹ค. ์ดํ›„ Aramco๊ฐ€ ์†Œ์ˆ˜ ์ง€๋ถ„์„ ์ธ์ˆ˜ํ–ˆ์Šต๋‹ˆ๋‹ค.

์ถœ์ฒ˜

  • Hugging Face โ€” humain-ai/ALLaM-7B-Instruct-preview (๋ชจ๋ธ ์นด๋“œ, GGUF ์–‘์žํ™”) โ€” huggingface.co
  • AraLingBench โ€” ์•„๋ž์–ด ์–ธ์–ด ๋ฒค์น˜๋งˆํฌ (arXiv 2511.14295) โ€” arxiv.org
  • Landscape of Arabic LLMs โ€” ์กฐ์‚ฌ (arXiv 2506.01340) โ€” arxiv.org
  • AraDiCE โ€” ์•„๋ž์–ด ๋ฐฉ์–ธ ๋ฐ ๋ฌธํ™” ํ‰๊ฐ€, COLING 2025 (arXiv 2409.11404) โ€” arxiv.org
  • ALLaM 34B ๊ธฐ๋ฐ˜ HUMAIN Chat ์ถœ์‹œ โ€” Middle East AI News โ€” middleeastainews.com
  • ์‚ฌ์šฐ๋”” ๋‚ด๊ฐ โ€” 2026๋…„์„ ์ธ๊ณต์ง€๋Šฅ์˜ ํ•ด๋กœ ์„ ์–ธ โ€” spa.gov.sa

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each providerโ€™s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Run PromptQuorum with a local LLM, your own API keys, or both โ€” you pick the backend.

Join the PromptQuorum Waitlist โ†’

โ† Back to Local LLMs

ALLaM, AceGPT ๋ฐ ์ตœ๊ณ ์˜ ์•„๋ž์–ด ๋กœ์ปฌ LLM 2026 | PromptQuorum