Key Takeaways
- 오픈 웨이트 1위, 전체 4위. GLM-5.2는 Artificial Analysis Intelligence Index v4.1에서 51점을 기록했습니다. 오픈 웨이트 모델 중 1위, 전체 4위이며, GLM-5.1(40점)보다 +11점, 다음 오픈 모델인 MiniMax-M3(44점)와 DeepSeek V4 Pro(44점)보다 약 7점 앞섭니다.
- 오픈 웨이트를 선도하지만, 전체 분야를 선도하는 것은 아닙니다. Claude Fable 5보다 약 5점 낮으며 전체적으로는 폐쇄형 프런티어 모델에 뒤집니다. "격차를 좁혔다"이지 "프런티어를 이겼다"가 아닙니다.
- 코딩에 강하지만 Opus 4.8 다음입니다. 독립 코딩 결과에서 GLM-5.2는 GPT-5.5를 앞서지만, 대부분의 1대1 비교에서는 Claude Opus 4.8에 뒤집니다.
- 약 744B 파라미터는 집에서 돌릴 수 없습니다. Mixture-of-Experts(토큰당 활성 약 40B)이지만 전체 모델은 멀티 GPU 또는 임대 GPU가 필요하며, 대폭 양자화된 1비트 GGUF 빌드만 소비자용 하드웨어에 맞습니다.
- 자체 호스팅 웨이트는 데이터를 지키지만, Z.ai API는 반드시 그렇지 않습니다. MIT 라이선스 웨이트는 사용자 경계 내에서 실행되지만, 퍼스트파티 Z.ai API는 중국 데이터 거주성 고려사항이 따릅니다.
- Z.ai 자체 벤치마크는 회사 보고치로 다루세요. 재현성에 이견이 있으므로 독립 평가인 Artificial Analysis 수치를 우선하세요.
GLM-5.2란?
GLM-5.2는 2026년 6월 13일 Z.ai(구 Zhipu AI)가 MIT 라이선스로 지역 사용 제한 없이 공개한 오픈 웨이트 대규모 언어 모델입니다. 2026년 6월 16일부터 공개적으로 벤치마크되었습니다.
- 총 약 744B 파라미터(출처에 따라 743B~753B)로, 토큰당 활성 파라미터 약 40B의 Mixture-of-Experts 아키텍처를 사용합니다.
- 1M 토큰 컨텍스트 윈도우와 최대 131,072 토큰 출력.
- 작업당 평균 약 43,000 출력 토큰 — GLM-5.1의 약 26,000보다 늘어났으며, 이는 로컬 추론 시간과 비용을 높입니다.
- MIT 라이선스: 지역 제한 없이 무료로 다운로드, 자체 호스팅, 수정이 가능합니다.
GLM-5.2는 얼마나 좋은가? 독립 벤치마크부터
유일한 독립적·교차 벤더 순위인 Artificial Analysis Intelligence Index v4.1에서 GLM-5.2는 51점으로 가장 높은 오픈 웨이트 모델이자 전체 4위입니다(Artificial Analysis, 2026년 6월).
| 모델 | Index v4.1 | 등급 |
|---|---|---|
| Claude Fable 5 | ~56 | 폐쇄형 프런티어 |
| GLM-5.2 | 51 | 오픈 웨이트 1위 / 전체 4위 |
| MiniMax-M3 | 44 | 오픈 웨이트 |
| DeepSeek V4 Pro | 44 | 오픈 웨이트 |
| GLM-5.1 (이전) | 40 | 오픈 웨이트 |
독립 코딩 결과: Terminal-Bench 2.1 — GLM-5.2는 81.0점, Claude Opus 4.8은 85.0점입니다. SWE-bench Pro — GLM-5.2는 62.1점(Z.ai 보고치)으로 GPT-5.5의 58.6점을 앞서며, 독립 보도도 그 순서를 뒷받침합니다. FrontierSWE — GLM-5.2는 74.4점(Z.ai 보고치)으로 GPT-5.5(72.6점)를 이기고 Opus 4.8(75.1점)에 약 1점 차로 뒤지며, 이 순서는 독립 보도가 확인합니다. 종합 독립 평가: GLM-5.2는 2026년 6월 기준 가장 강력한 오픈 소스 코딩 모델이지만, 대부분의 1대1 비교에서 여전히 Claude Opus 4.8에 뒤집니다(VentureBeat; letsdatascience, 2026년 6월).
Z.ai 자체 수치 vs 독립 결과: 신중하게 읽기
여러 대표 수치는 Z.ai 자체 평가에서 나온 것이므로 독립 검증된 값이 아닌 회사 보고치로 읽어야 합니다.
- 회사 보고 코딩 수치 — 예를 들어 MCP-Atlas 77.0(Z.ai 보고치), GPT-5.5 75.3, Opus 4.8 77.8 — 는 Z.ai 자체가 측정한 것이므로 독립 재현 전까지 주장으로 다루어야 합니다.
- Artificial Analysis 분석은 Z.ai의 내부 평가가 공개 벤치마크보다 낮게 보고되었다고 지적하며, 재현성에 이견이 있습니다.
- 재현성은 미해결 문제입니다. 적어도 한 저명한 논평가는 이 모델을 "bench-maxxed"라고 평했으며, GLM-5.1은 GLM-5.2가 지금 잘 해내는 어떤 벤치마크에서 0%를 기록했다고 보고됩니다. 현재 "오픈 웨이트 1위" 주장을 뒷받침하는 것은 Z.ai 자체 평가가 아니라 독립 평가인 Artificial Analysis Index입니다.
GLM-5.2를 집에서 돌릴 수 있나요? 약 744B 현실 점검
아니요 — 전체 모델은 안 됩니다. "오픈 웨이트"와 "자체 호스팅 가능"이 "일반 가정용 PC에서 돌아간다"는 뜻은 아닙니다.
- 전체 GLM-5.2는 상당한 인프라가 필요합니다. 멀티 GPU 서버 또는 임대 클라우드 GPU.
- 소비자용 하드웨어에서는 대폭 양자화된 1비트 GGUF 빌드만 실행 가능하며, 품질과 속도의 트레이드오프가 따릅니다.
- 작업당 약 43,000 토큰의 높은 출력량은 로컬 시간과 비용을 더욱 높입니다.
- 대형 로컬 모델의 하드웨어 현실은 소비자용 하드웨어에서 70B 모델 돌리기, 로컬 LLM용 중고 GPU, 로컬 LLM 하드웨어 가이드 2026, 로컬 LLM용 Apple Silicon M5를 참고하세요.
자체 호스팅 웨이트 vs Z.ai API: 데이터는 어디로 가는가
라이선스와 API는 서로 다른 데이터 거버넌스 이야기입니다. 자체 호스팅 MIT 웨이트는 데이터를 사용자 경계 안에 두지만, 퍼스트파티 Z.ai API는 그렇지 않습니다.
- 자체 호스팅(MIT 웨이트): 데이터가 로컬에 남고 사용자 소유입니다 — 제3자 전송 없음.
- Z.ai 퍼스트파티 API: 독립 보도는 API 경로에 대해 중국 데이터 거주성 고려사항("중국 데이터 리스크")을 명시적으로 지적합니다(TechTimes, 2026년 6월 17일).
- 의사결정 기준: 데이터 민감도가 중요하다면 웨이트를 자체 호스팅하세요. 호스티드 API를 사용한다면 해당 관할권의 적용을 받는 제3자 클라우드 엔드포인트처럼 다루세요.
GLM-5.2 가격과 비용
호스티드 API를 통하면 GLM-5.2는 폐쇄형 프런티어 모델의 약 1/6 비용으로 실행됩니다(VentureBeat, 2026년 6월). 보고된 가격은 입력 100만 토큰당 약 $1.4, 출력 100만 토큰당 약 $4.4입니다(2026년 6월 기준). 실제 워크로드 비용을 추산할 때는 작업당 높은 출력량(약 43,000 토큰)을 고려하세요.
GLM-5.2를 써야 할까요?
GLM-5.2 의사결정 가이드
Use a local LLM if:
- •현재 사용 가능한 가장 강력한 오픈 웨이트 모델을 원함
- •자체 경계 안에서 자체 호스팅과 데이터 통제가 필요함
- •장기 호흡의 코딩 작업을 수행함
- •약 1/6 비용으로 프런티어에 근접한 품질을 원함
Use a cloud model if:
- •1대1 코딩이나 추론에서 최고 점수가 필요함
- •오픈 웨이트가 필요하지 않고 Claude Opus 4.8 같은 폐쇄형 프런티어 모델을 선호함
- •멀티 GPU 또는 임대 GPU 인프라를 마련할 수 없음
Quick decision:
- →오늘날 최고의 오픈 웨이트 선택지입니다 — 다만 도입을 확정하기 전에 이견이 있는 벤치마크를 자신의 작업으로 검증하세요.
GLM-5.2: 지역별 고려사항
한국 / PIPA: MIT 라이선스로 GLM-5.2를 자체 호스팅하면 모든 추론 데이터가 자체 인프라 안에 남아, 개인정보 보호법(PIPA)에서 기대하는 데이터 거주성을 충족하는 데 도움이 됩니다. 추론이 로컬에서 실행될 때 모델 간 컴플라이언스 차이는 데이터 처리 방식이 아니라 공급업체 문서에 있습니다. 운영 배포 시에는 모델 버전(GLM-5.2), 라이선스(MIT), 자체 호스팅 웨이트인지 Z.ai API인지를 문서화하고, 필요 시 개인정보보호위원회(PIPC) 지침을 참고하세요.
EU / GDPR: MIT 라이선스로 GLM-5.2를 자체 호스팅하면 모든 추론 데이터가 자체 인프라 안에 남아 GDPR의 데이터 거주성 기대를 충족합니다. 추론이 로컬에서 실행될 때 모델 간 컴플라이언스 차이는 데이터 처리 방식이 아니라 공급업체 문서에 있습니다.
중국 / 데이터 경로: GLM-5.2는 중국 연구소가 만든 모델입니다. 핵심 컴플라이언스 지렛대는 모델이 아니라 배포 경로입니다. 자체 호스팅 MIT 웨이트는 데이터를 사용자 경계 안에 두지만, 퍼스트파티 Z.ai API는 본국 관할권의 적용을 받습니다. 데이터 거주성 요건에 맞는 경로를 선택하세요.
GLM-5.2 평가 시 흔한 실수
- "오픈 웨이트"가 "집에서 돌아간다"는 뜻이라고 가정하기. 약 744B 규모는 멀티 GPU 또는 임대 인프라가 필요하며, 1비트 GGUF 빌드만 소비자용 하드웨어에 맞습니다.
- Z.ai 퍼스트파티 벤치마크를 검증된 것으로 취급하기. 독립 평가인 Artificial Analysis Index를 우선하고, 회사가 측정한 코딩 수치는 주장으로 다루세요.
- 데이터 거버넌스에서 MIT 웨이트와 호스티드 API를 혼동하기. 자체 호스팅은 데이터를 로컬에 두지만, API는 본국 관할권의 적용을 받습니다.
- "오픈 웨이트 1위"를 "프런티어를 이겼다"로 읽기. GLM-5.2는 전체 4위이며 대부분의 1대1 비교에서 Claude Opus 4.8에 뒤집니다.
- 추론 시간과 비용을 잡을 때 작업당 약 43,000 토큰 출력량을 무시하기.
자주 묻는 질문
GLM-5.2가 현재 최고의 오픈 웨이트 모델인가요?
독립 평가인 Artificial Analysis Intelligence Index v4.1(2026년 6월) 기준으로는 그렇습니다 — GLM-5.2는 51점으로 최고의 오픈 웨이트 결과이자 전체 4위입니다. 다음 오픈 모델인 MiniMax-M3와 DeepSeek V4 Pro(둘 다 44점)를 약 7점 앞섭니다. 다만 전체적으로 폐쇄형 프런티어 모델을 이기지는 못합니다.
일반 PC나 Mac에서 GLM-5.2를 돌릴 수 있나요?
전체 모델은 안 됩니다. 약 744B 파라미터라 멀티 GPU 서버나 임대 클라우드 GPU가 필요합니다. 소비자용 하드웨어에서는 품질과 속도를 희생하는 대폭 양자화된 1비트 GGUF 빌드로 제한됩니다. 대형 로컬 모델이 실제로 무엇을 요구하는지는 하드웨어 가이드를 참고하세요.
GLM-5.2가 GPT-5.5와 Claude Opus 4.8을 이기나요?
코딩에서는 독립 결과가 GLM-5.2를 GPT-5.5보다 앞에 둡니다(예: SWE-bench Pro와 FrontierSWE 순서). Claude Opus 4.8과 비교하면 대부분의 1대1 비교에서 뒤집니다 — 예를 들어 Terminal-Bench 2.1(81.0 vs 85.0)과 FrontierSWE(약 1점 차). 정확한 요약은 "오픈 웨이트를 선도하고 프런티어와의 격차를 좁혔다"이지 "프런티어를 이겼다"가 아닙니다.
GLM-5.2는 정말 무료인가요? 라이선스는 무엇인가요?
GLM-5.2는 지역 사용 제한이 없는 MIT 라이선스로 공개되어 무료로 다운로드, 자체 호스팅, 수정할 수 있습니다. 전체 모델을 돌리려면 여전히 실제 인프라 비용(멀티 GPU 또는 임대 GPU)이 들고, 호스티드 Z.ai API는 유료 서비스입니다.
GLM-5.2에서 제 데이터는 안전한가요?
배포 경로에 따라 다릅니다. 자체 호스팅 MIT 웨이트는 모든 데이터를 자체 경계 안에 둡니다. 퍼스트파티 Z.ai API는 독립 보도가 지적한 중국 데이터 거주성 고려사항이 따르므로, 해당 관할권의 적용을 받는 제3자 클라우드 엔드포인트처럼 다루세요.
GLM-5.2의 벤치마크 수치를 신뢰할 수 있나요?
독립 평가인 Artificial Analysis Index는 "오픈 웨이트 1위" 순위를 뒷받침합니다. Z.ai 자체 코딩 수치는 회사 보고치이며 재현성에 이견이 있습니다 — Artificial Analysis 분석은 내부 평가가 공개 벤치마크보다 낮게 보고되었다고 지적합니다. 독립 수치를 우선하고 퍼스트파티 수치는 주장으로 다루세요.
GLM-5.2를 API로 돌리는 비용은 얼마인가요?
폐쇄형 프런티어 모델의 약 1/6 비용입니다. 보고된 가격은 입력 100만 토큰당 약 $1.4, 출력 100만 토큰당 약 $4.4입니다(2026년 6월). GLM-5.2는 작업당 평균 약 43,000 출력 토큰을 사용하므로, 토큰당 요율만이 아니라 자신의 워크로드로 실제 비용을 추산하세요.
GLM-5.2를 제대로 자체 호스팅하려면 어떤 하드웨어가 필요한가요?
전체 모델에는 멀티 GPU 서버 또는 임대 클라우드 GPU가 필요합니다. 소비자용 하드웨어는 대폭 양자화된 1비트 GGUF 빌드만 돌릴 수 있습니다. 환경 규모를 가늠하려면 로컬 LLM 하드웨어 가이드 2026, 로컬 LLM용 중고 GPU, 소비자용 하드웨어에서 70B 모델 돌리기를 참고하세요.
출처
- Artificial Analysis. (2026). "GLM-5.2 is the new leading open-weights model on the Artificial Analysis Intelligence Index." https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index — 독립 Intelligence Index v4.1 순위(51점, 오픈 1위 / 전체 4위).
- TechTimes. (2026, June 17). "GLM-5.2 open weights live, tops coding benchmark; API use carries China data risk." https://www.techtimes.com/articles/318543/20260617/glm-52-open-weights-live-top-coding-benchmark-api-use-carries-china-data-risk.htm — Z.ai API 경로의 데이터 거주성 고려사항.
- VentureBeat. (2026). "Z.ai's open-weights GLM-5.2 beats GPT-5.5 on multiple long-horizon coding benchmarks for 1/6th the cost." https://venturebeat.com/technology/z-ais-open-weights-glm-5-2-beats-gpt-5-5-on-multiple-long-horizon-coding-benchmarks-for-1-6th-the-cost — 독립 코딩 비교 및 비용 분석.
- LetsDataScience. (2026). "GLM-5.2 open weights beats GPT-5.5 coding." https://letsdatascience.com/blog/glm-5-2-open-weights-beats-gpt-5-5-coding — 코딩 결과에 대한 독립 보도.