关键要点
- 开源权重第一,整体第四。 GLM-5.2 在 Artificial Analysis Intelligence Index v4.1 上得 51 分——顶级开源权重模型,整体第四,比 GLM-5.1(40)高出 11 分,并领先于下一梯队开源模型 MiniMax-M3(44)和 DeepSeek V4 Pro(44)约 7 分。
- 它领跑开源权重,而非整个领域。 它大约比 Claude Fable 5 低 5 分,整体排在闭源前沿模型之后。这是"缩小差距",而非"击败前沿"。
- 编程能力强,仅次于 Opus 4.8。 独立编程测评显示 GLM-5.2 领先 GPT-5.5,但在大多数正面对比中落后于 Claude Opus 4.8。
- 约 744B 参数无法在家本地运行。 它采用 Mixture-of-Experts(每 token 约 40B 激活参数),但完整模型需要多 GPU 或租用 GPU;只有大幅量化的 1-bit GGUF 版本才能装进消费级硬件。
- 自托管权重让数据留在本地;Z.ai API 则不一定。 MIT 许可的权重在你的边界内运行;而第一方 Z.ai API 涉及中国数据驻留方面的考量。
- 应将 Z.ai 自报基准视为公司自测数据。 可复现性存在争议——应以独立的 Artificial Analysis 数据为准。
GLM-5.2 是什么?
GLM-5.2 是一款开源权重大语言模型,由 Z.ai(前身为 Zhipu AI)于 2026 年 6 月 13 日以 MIT 许可证发布,无地区使用限制。 它自 2026 年 6 月 16 日起被公开测评。
- 约 744B 总参数(各方来源引用 743B–753B),采用 Mixture-of-Experts 架构,每 token 约 40B 激活参数。
- 1M token 上下文窗口,最大输出 131,072 token。
- 平均每项任务约 43,000 输出 token——高于 GLM-5.1 的约 26,000——这会增加本地推理的时间与成本。
- MIT 许可证: 可免费下载、自托管和修改,无地区限制。
GLM-5.2 有多强?先看独立基准测试
在唯一一个独立的跨厂商排名——Artificial Analysis Intelligence Index v4.1——上,GLM-5.2 是得分最高的开源权重模型,51 分,整体第四(Artificial Analysis,2026 年 6 月)。
| 模型 | Index v4.1 | 梯队 |
|---|---|---|
| Claude Fable 5 | ~56 | 闭源前沿 |
| GLM-5.2 | 51 | 开源权重第一 / 整体第四 |
| MiniMax-M3 | 44 | 开源权重 |
| DeepSeek V4 Pro | 44 | 开源权重 |
| GLM-5.1(上一代) | 40 | 开源权重 |
独立编程测评结果:Terminal-Bench 2.1——GLM-5.2 得 81.0,Claude Opus 4.8 为 85.0。SWE-bench Pro——GLM-5.2 为 62.1(Z.ai 自报分值)领先于 GPT-5.5 的 58.6;独立报道印证了这一排序。FrontierSWE——GLM-5.2 为 74.4(Z.ai 自报分值),击败 GPT-5.5(72.6),并以约一分之差落后于 Opus 4.8(75.1),这一排序也得到了独立报道的确认。综合独立结论:GLM-5.2 是截至 2026 年 6 月可获得的最强开源编程模型,但在大多数正面对比中仍落后于 Claude Opus 4.8(VentureBeat;letsdatascience,2026 年 6 月)。
Z.ai 自报数据 vs 独立结果:请谨慎解读
若干头条数字来自 Z.ai 自己的评测,应被视为公司自报、而非经过独立验证。
- 公司自报的编程数字——例如 MCP-Atlas 77.0(Z.ai 自报),对比 GPT-5.5 的 75.3 和 Opus 4.8 的 77.8——由 Z.ai 自行运行,应在独立复现之前作为厂商声明对待。
- Artificial Analysis 的评述指出,Z.ai 的内部评测所报告的结果弱于其公布的基准成绩,且可复现性存在争议。
- 可复现性仍是一个悬而未决的问题。 至少有一位知名评论者将该模型形容为"刷榜(bench-maxxed)",据称 GLM-5.1 在至少一项 GLM-5.2 如今表现良好的基准上曾得 0%。当前支撑"开源权重第一"这一说法的,是独立的 Artificial Analysis Index,而非 Z.ai 自家的测评套件。
你能在家本地运行 GLM-5.2 吗?约 744B 的现实考量
不能——至少完整模型不行。"开源权重"和"可自托管"并不意味着"能在普通家用 PC 上运行"。
- 完整的 GLM-5.2 需要强大的基础设施: 多 GPU 服务器或租用的云 GPU。
- 在消费级硬件上,只有大幅量化的 1-bit GGUF 版本可行,并伴随质量和速度上的取舍。
- 每项任务约 43,000 token 的高输出量进一步推高了本地的时间与成本。
- 关于大型本地模型的硬件现实,参见 在消费级硬件上运行 70B 模型、本地 LLM 二手 GPU、本地 LLM 硬件指南 2026,以及 Apple Silicon M5 本地 LLM。
自托管权重 vs Z.ai API:你的数据去了哪里
许可证与 API 是两种不同的数据治理路径。自托管的 MIT 权重让数据留在你的边界之内;第一方 Z.ai API 则不然。
- 自托管(MIT 权重): 数据保留在本地、归你所有——不向第三方传输。
- Z.ai 第一方 API: 独立报道明确指出该 API 路径存在中国数据驻留方面的考量("中国数据风险")(TechTimes,2026 年 6 月 17 日)。
- 决策框架: 若数据敏感性重要,请自托管权重;若使用托管 API,则应将其视为受其管辖法域约束的任何第三方云端点来对待。
GLM-5.2 定价与成本
通过托管 API,GLM-5.2 的成本约为闭源前沿模型的六分之一(VentureBeat,2026 年 6 月)。 据报道,定价约为每 1M 输入 token $1.4、每 1M 输出 token $4.4(截至 2026 年 6 月)。在估算真实工作负载成本时,请将每项任务的高输出量(约 43,000 token)纳入考量。
你应该用 GLM-5.2 吗?
GLM-5.2 决策指南
Use a local LLM if:
- •你想要目前可获得的最强开源权重模型
- •你需要在自己的边界内自托管并掌控数据
- •你运行长时程的编程任务
- •你想以约六分之一的成本获得接近前沿的质量
Use a cloud model if:
- •你在正面编程或推理对比中需要最高分
- •你不要求开源权重,且更倾向于像 Claude Opus 4.8 这样的闭源前沿模型
- •你无法配置多 GPU 或租用 GPU 基础设施
Quick decision:
- →当下最佳的开源权重选项——但在投入之前,请用你自己的任务验证那些存在争议的基准结果。
GLM-5.2:区域合规背景
中国(《数据安全法》): GLM-5.2 由中国实验室构建,核心合规杠杆在于部署路径、而非模型本身。在 MIT 许可下自托管 GLM-5.2,可使全部推理数据保留在你自有的基础设施之内,从而将数据保持在你的边界以内,契合《数据安全法》(2021)下的数据驻留要求;而第一方 Z.ai API 则受其所在法域管辖。请根据你的数据驻留要求选择相应路径。
亚太地区(数据跨境): 对于跨境数据流动,关键在于明确推理在何处运行。自托管权重让数据留在你选定的司法辖区内,便于符合各地的数据驻留与跨境传输框架;而托管 API 则会将数据带入供应商的本国法域。在多辖区部署时,应将部署路径与各市场的合规要求逐一对应。
企业部署: 对于金融、医疗、法律等受监管行业的大型企业(银行、医院、律师事务所),应记录模型版本(GLM-5.2)、许可证(MIT),以及推理是运行在自托管权重还是 Z.ai API 上。自托管的 MIT 权重将敏感数据保留在企业内部,是满足行业监管与审计要求最直接的路径。
评估 GLM-5.2 时的常见错误
- 误以为"开源权重"就意味着"能在家运行"。 约 744B 的规模需要多 GPU 或租用基础设施;只有 1-bit GGUF 版本才能装进消费级硬件。
- 把 Z.ai 第一方基准当作已验证数据。 应以独立的 Artificial Analysis Index 为准;将公司自行运行的编程数字视为厂商声明。
- 在数据治理上将 MIT 权重与托管 API 混为一谈。 自托管让数据保留在本地;API 则受其本国法域约束。
- 把"开源权重第一"误读为"击败前沿"。 GLM-5.2 整体排名第四,在大多数正面对比中落后于 Claude Opus 4.8。
- 在估算推理时间与成本时忽视每项任务约 43,000 token 的输出量。
常见问题
GLM-5.2 是目前最好的开源权重模型吗?
按独立的 Artificial Analysis Intelligence Index v4.1(2026 年 6 月),是的——GLM-5.2 得 51 分,是顶级开源权重成绩,整体第四。它领先于下一梯队开源模型 MiniMax-M3 和 DeepSeek V4 Pro(均为 44)约 7 分。不过,它在整体上并未击败闭源前沿模型。
我能在普通 PC 或 Mac 上运行 GLM-5.2 吗?
完整模型不行。约 744B 参数需要多 GPU 服务器或租用的云 GPU。在消费级硬件上,你只能使用大幅量化的 1-bit GGUF 版本,并以质量和速度为代价。关于大型本地模型的真实需求,请参阅我们的硬件指南。
GLM-5.2 击败了 GPT-5.5 和 Claude Opus 4.8 吗?
在编程方面,独立结果显示 GLM-5.2 领先 GPT-5.5(例如 SWE-bench Pro 和 FrontierSWE 的排序)。但对比 Claude Opus 4.8,它在大多数正面对比中落后——例如 Terminal-Bench 2.1(81.0 对 85.0)和 FrontierSWE(落后约一分)。准确的概括是"领跑开源权重、缩小与前沿的差距",而非"击败前沿"。
GLM-5.2 真的免费吗?它的许可证是什么?
GLM-5.2 以 MIT 许可证发布,无地区使用限制,因此你可以免费下载、自托管和修改它。运行完整模型仍需真实的基础设施成本(多 GPU 或租用 GPU),而托管的 Z.ai API 是付费服务。
使用 GLM-5.2 我的数据安全吗?
这取决于部署路径。自托管的 MIT 权重将所有数据保留在你自有的边界之内。第一方 Z.ai API 涉及独立报道所指出的中国数据驻留考量,因此应将其视为受其管辖法域约束的任何第三方云端点来对待。
GLM-5.2 的基准测试数字可信吗?
独立的 Artificial Analysis Index 印证了"开源权重第一"的排名。Z.ai 自家的编程数字属于公司自报,且可复现性存在争议——Artificial Analysis 的评述指出其内部评测所报告的结果弱于公布的基准。应以独立数字为准,并将第一方数据视为厂商声明。
通过 API 运行 GLM-5.2 的成本是多少?
约为闭源前沿模型成本的六分之一。据报道,定价约为每 1M 输入 token $1.4、每 1M 输出 token $4.4(2026 年 6 月)。由于 GLM-5.2 平均每项任务约 43,000 输出 token,请基于你自己的工作负载估算真实成本,而不要仅看每 token 单价。
正确自托管 GLM-5.2 需要什么硬件?
运行完整模型需要多 GPU 服务器或租用的云 GPU。消费级硬件只能运行大幅量化的 1-bit GGUF 版本。请参阅《本地 LLM 硬件指南 2026》《本地 LLM 二手 GPU》以及《在消费级硬件上运行 70B 模型》来确定你的配置规格。
来源
- Artificial Analysis. (2026). "GLM-5.2 is the new leading open-weights model on the Artificial Analysis Intelligence Index." https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index —— 独立 Intelligence Index v4.1 排名(51,开源第一 / 整体第四)。
- TechTimes. (2026, June 17). "GLM-5.2 open weights live, tops coding benchmark; API use carries China data risk." https://www.techtimes.com/articles/318543/20260617/glm-52-open-weights-live-top-coding-benchmark-api-use-carries-china-data-risk.htm —— Z.ai API 路径上的数据驻留考量。
- VentureBeat. (2026). "Z.ai's open-weights GLM-5.2 beats GPT-5.5 on multiple long-horizon coding benchmarks for 1/6th the cost." https://venturebeat.com/technology/z-ais-open-weights-glm-5-2-beats-gpt-5-5-on-multiple-long-horizon-coding-benchmarks-for-1-6th-the-cost —— 独立编程对比与成本测算。
- LetsDataScience. (2026). "GLM-5.2 open weights beats GPT-5.5 coding." https://letsdatascience.com/blog/glm-5-2-open-weights-beats-gpt-5-5-coding —— 编程结果的独立报道。