重要なポイント
- オープンウェイト1位、全体4位。 GLM-5.2はArtificial Analysis Intelligence Index v4.1で51ポイントを獲得し、トップのオープンウェイトモデルで全体4位です。GLM-5.1(40)から+11、次点のオープンモデルMiniMax-M3(44)とDeepSeek V4 Pro(44)を約7ポイント引き離しています。
- オープンウェイトでは首位だが、全体での首位ではない。 Claude Fable 5より約5ポイント下で、全体ではクローズドフロンティアの後塵を拝します。「差を縮める」のであって「フロンティアを超える」のではありません。
- コーディングは強力だが、Opus 4.8に次ぐ2番手。 独立系のコーディング結果では、GLM-5.2はGPT-5.5を上回るものの、ほとんどの直接対決ではClaude Opus 4.8に及びません。
- 約744Bパラメータは自宅では動かせない。 Mixture-of-Experts(トークンあたりアクティブ約40B)ですが、フルモデルにはマルチGPUまたはレンタルGPUが必要です。コンシューマー向けハードウェアに収まるのは大幅に量子化された1-bit GGUFビルドのみです。
- 自己ホストのウェイトはデータを保持するが、Z.ai APIは必ずしもそうではない。 MITライセンスのウェイトは自社の境界内で動作しますが、ファーストパーティのZ.ai APIには中国のデータ所在に関する考慮事項が伴います。
- Z.ai自身のベンチマークは企業申告値として扱う。 再現性には議論があり、独立系のArtificial Analysisの数値を優先してください。
GLM-5.2とは?
GLM-5.2は、2026年6月13日にZ.ai(旧Zhipu AI)がMITライセンスで地域別の利用制限なしにリリースした、オープンウェイトの大規模言語モデルです。 2026年6月16日から公開ベンチマークが行われました。
- 総パラメータ約744B(出典により743B〜753Bと記載)。Mixture-of-Expertsアーキテクチャを採用し、トークンあたりアクティブパラメータは約40Bです。
- 1Mトークンのコンテキストウィンドウ、最大出力は131,072トークン。
- タスクあたり平均約43,000の出力トークン(GLM-5.1の約26,000から増加)。これによりローカル推論の時間とコストが上昇します。
- MITライセンス: 地域制限なしで無料ダウンロード、自己ホスト、改変が可能です。
GLM-5.2はどれほど優秀か?まずは独立系ベンチマークから
唯一の独立した複数ベンダー横断ランキングであるArtificial Analysis Intelligence Index v4.1では、GLM-5.2は51ポイントで最上位のオープンウェイトモデルであり、全体4位です(Artificial Analysis、2026年6月)。
| モデル | Index v4.1 | ティア |
|---|---|---|
| Claude Fable 5 | ~56 | クローズドフロンティア |
| GLM-5.2 | 51 | オープンウェイト1位/全体4位 |
| MiniMax-M3 | 44 | オープンウェイト |
| DeepSeek V4 Pro | 44 | オープンウェイト |
| GLM-5.1(旧バージョン) | 40 | オープンウェイト |
独立系のコーディング結果:Terminal-Bench 2.1ではGLM-5.2が81.0、Claude Opus 4.8が85.0。SWE-bench ProではGLM-5.2が62.1(Z.ai申告値)でGPT-5.5の58.6を上回り、独立系の報道もその順序を裏付けています。FrontierSWEではGLM-5.2が74.4(Z.ai申告値)でGPT-5.5(72.6)を上回り、Opus 4.8(75.1)に約1ポイント及びません。この順序も独立系の報道で確認されています。独立系の総合的な評価:GLM-5.2は2026年6月時点で利用可能な最も強力なオープンソースのコーディングモデルですが、ほとんどの直接対決ではなおClaude Opus 4.8に及びません(VentureBeat、letsdatascience、2026年6月)。
Z.ai自身の数値 vs 独立系の結果:慎重に読むこと
いくつかの目玉となる数値はZ.ai自身の評価によるもので、独立検証されたものではなく企業申告値として読むべきです。
- 企業申告のコーディング数値 — 例えばMCP-Atlas 77.0(Z.ai申告値)はGPT-5.5の75.3、Opus 4.8の77.8と対比されますが、これらはZ.ai自身が実行したものであり、独立した再現が行われるまでは主張として扱うべきです。
- Artificial Analysisの解説では、Z.aiの内部評価が公表ベンチマークより弱く報告されたと指摘されており、再現性には議論があります。
- 再現性は未解決の問題です。 少なくとも一人の著名な論者はこのモデルを「ベンチマーク最適化(bench-maxxed)」と評しており、GLM-5.1はGLM-5.2が今では好成績を出す少なくとも1つのベンチマークで0%だったと報じられています。現時点で「オープンウェイト1位」の主張を裏付けているのは、Z.ai自身のスイートではなく、独立系のArtificial Analysis Indexです。
GLM-5.2を自宅で動かせるか?約744Bという現実
いいえ — フルモデルは動きません。「オープンウェイト」や「自己ホスト可能」は「一般的な家庭用PCで動く」という意味ではありません。
- フルのGLM-5.2には本格的なインフラが必要です: マルチGPUサーバー、またはレンタルしたクラウドGPU。
- コンシューマー向けハードウェアでは、大幅に量子化された1-bit GGUFビルドのみが現実的で、品質と速度のトレードオフを伴います。
- タスクあたり約43,000トークンという高い出力が、ローカルでの時間とコストをさらに押し上げます。
- 大規模ローカルモデルのハードウェアの現実については、コンシューマー向けハードウェアで70Bモデルを動かす、ローカルLLM向け中古GPU、ローカルLLMハードウェアガイド2026、ローカルLLM向けApple Silicon M5を参照してください。
自己ホストのウェイト vs Z.ai API:データの行き先
ライセンスとAPIはデータガバナンス上、別々の話です。自己ホストのMITウェイトはデータを自社の境界内に保持しますが、ファーストパーティのZ.ai APIはそうではありません。
- 自己ホスト(MITウェイト): データはローカルかつ自社のもので、第三者への送信はありません。
- Z.aiファーストパーティAPI: 独立系の報道は、APIの経路において中国のデータ所在に関する考慮事項(「中国のデータリスク」)を明示的に指摘しています(TechTimes、2026年6月17日)。
- 判断の枠組み: データの機密性が重要なら、ウェイトを自己ホストしてください。ホスト型APIを使う場合は、その管轄に従う他の第三者クラウドエンドポイントと同様に扱ってください。
GLM-5.2の価格とコスト
ホスト型API経由では、GLM-5.2はクローズドフロンティアモデルの約1/6のコストで動作します(VentureBeat、2026年6月)。 報告されている価格は、入力100万トークンあたり約$1.4、出力100万トークンあたり約$4.4です(2026年6月時点)。実際のワークロードのコストを見積もる際は、タスクあたりの高い出力(約43,000トークン)を考慮してください。
GLM-5.2を使うべきか?
GLM-5.2 判断ガイド
Use a local LLM if:
- •現時点で利用可能な最も強力なオープンウェイトモデルが欲しい
- •自社の境界内での自己ホストとデータ管理が必要
- •長時間にわたるコーディングタスクを実行する
- •フロンティアに近い品質を約1/6のコストで求める
Use a cloud model if:
- •直接対決のコーディングや推論で最高スコアが必要
- •オープンウェイトを必須とせず、Claude Opus 4.8のようなクローズドフロンティアモデルを好む
- •マルチGPUまたはレンタルGPUのインフラを用意できない
Quick decision:
- →現時点で最良のオープンウェイトの選択肢ですが、採用を決める前に、議論のあるベンチマークを自分のタスクで検証してください。
GLM-5.2:地域別の文脈
日本(METI): 本番デプロイでは、モデルのバージョン(GLM-5.2)、ライセンス(MIT)、そして推論を自己ホストのウェイトで実行するかZ.ai APIで実行するかを、経済産業省(METI)のAIガバナンス指針(AI事業者ガイドライン)に沿って文書化してください。MITライセンスでGLM-5.2を自己ホストすれば、すべての推論データが自社インフラ内に留まり、国内のデータ所在に関する期待に応えられます。
東アジア/アジア太平洋: この地域全体で、重要な順守上のレバーはモデルそのものではなくデプロイ経路です。自己ホストのMITウェイトはデータを自社の境界内に保持し、各国のデータ所在要件に整合します。ファーストパーティAPIを利用する場合は、その提供元の管轄に従う他のクラウドエンドポイントと同様に扱ってください。
グローバル/データ経路: GLM-5.2は中国のラボが開発したモデルです。重要な順守上のレバーはモデルではなくデプロイ経路です。自己ホストのMITウェイトはデータを自社の境界内に保持しますが、ファーストパーティのZ.ai APIはその本国の管轄に服します。自社のデータ所在要件に合致する経路を選んでください。
GLM-5.2を評価する際のよくある間違い
- 「オープンウェイト」を「自宅で動く」と思い込む。 約744Bという規模にはマルチGPUまたはレンタルインフラが必要で、コンシューマー向けハードウェアに収まるのは1-bit GGUFビルドのみです。
- Z.aiのファーストパーティのベンチマークを検証済みとして扱う。 独立系のArtificial Analysis Indexを優先し、企業が実行したコーディング数値は主張として扱ってください。
- データガバナンスにおいてMITウェイトとホスト型APIを混同する。 自己ホストはデータをローカルに保持しますが、APIはその本国の管轄に服します。
- 「オープンウェイト1位」を「フロンティアを超える」と読む。 GLM-5.2は全体4位で、ほとんどの直接対決ではClaude Opus 4.8に及びません。
- タスクあたり約43,000トークンの出力を無視する — 推論の時間とコストを見積もる際に考慮してください。
よくある質問
GLM-5.2は現時点で最良のオープンウェイトモデルですか?
独立系のArtificial Analysis Intelligence Index v4.1(2026年6月)によれば、はい — GLM-5.2は51ポイントで、トップのオープンウェイト結果かつ全体4位です。次点のオープンモデルであるMiniMax-M3とDeepSeek V4 Pro(ともに44)を約7ポイント引き離しています。ただし、全体ではクローズドフロンティアを超えてはいません。
GLM-5.2を普通のPCやMacで動かせますか?
フルモデルは動きません。約744Bパラメータのため、マルチGPUサーバーまたはレンタルしたクラウドGPUが必要です。コンシューマー向けハードウェアでは、品質と速度を犠牲にする大幅に量子化された1-bit GGUFビルドに限られます。大規模なローカルモデルが実際に何を必要とするかは、当サイトのハードウェアガイドを参照してください。
GLM-5.2はGPT-5.5やClaude Opus 4.8を上回りますか?
コーディングでは、独立系の結果がGLM-5.2をGPT-5.5より上に位置づけています(例:SWE-bench ProやFrontierSWEの順序)。Claude Opus 4.8に対しては、ほとんどの直接対決で及びません — 例えばTerminal-Bench 2.1(81.0 対 85.0)やFrontierSWE(約1ポイント差)です。正確な要約は「フロンティアを超える」ではなく「オープンウェイトで首位、フロンティアとの差を縮める」です。
GLM-5.2は本当に無料ですか?ライセンスは何ですか?
GLM-5.2は地域別の利用制限なしのMITライセンスでリリースされているため、無料でダウンロード、自己ホスト、改変ができます。フルモデルの実行には依然として実際のインフラ(マルチGPUまたはレンタルGPU)のコストがかかり、ホスト型のZ.ai APIは有料サービスです。
GLM-5.2で私のデータは安全ですか?
デプロイ経路によります。自己ホストのMITウェイトは、すべてのデータを自社の境界内に保持します。ファーストパーティのZ.ai APIには、独立系の報道が指摘する中国のデータ所在に関する考慮事項が伴うため、その管轄に従う他の第三者クラウドエンドポイントと同様に扱ってください。
GLM-5.2のベンチマーク数値は信頼できますか?
独立系のArtificial Analysis Indexは「オープンウェイト1位」のランキングを裏付けています。Z.ai自身のコーディング数値は企業申告値であり、再現性には議論があります — Artificial Analysisの解説は、内部評価が公表ベンチマークより弱く報告されたと指摘しています。独立系の数値を優先し、ファーストパーティの数値は主張として扱ってください。
GLM-5.2をAPI経由で動かすコストはどのくらいですか?
クローズドフロンティアモデルの約1/6のコストです。報告されている価格は、入力100万トークンあたり約$1.4、出力100万トークンあたり約$4.4です(2026年6月)。GLM-5.2はタスクあたり平均約43,000の出力トークンを使うため、トークン単価だけでなく、自分のワークロードで実際のコストを見積もってください。
GLM-5.2を適切に自己ホストするにはどんなハードウェアが必要ですか?
フルモデルには、マルチGPUサーバーまたはレンタルしたクラウドGPUが必要です。コンシューマー向けハードウェアでは、大幅に量子化された1-bit GGUFビルドしか動かせません。構成のサイジングには、ローカルLLMハードウェアガイド2026、ローカルLLM向け中古GPU、コンシューマー向けハードウェアで70Bモデルを動かす、を参照してください。
出典
- Artificial Analysis. (2026). "GLM-5.2 is the new leading open-weights model on the Artificial Analysis Intelligence Index." https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index — 独立系Intelligence Index v4.1のランキング(51、オープン1位/全体4位)。
- TechTimes. (2026, June 17). "GLM-5.2 open weights live, tops coding benchmark; API use carries China data risk." https://www.techtimes.com/articles/318543/20260617/glm-52-open-weights-live-top-coding-benchmark-api-use-carries-china-data-risk.htm — Z.ai APIの経路におけるデータ所在の考慮事項。
- VentureBeat. (2026). "Z.ai's open-weights GLM-5.2 beats GPT-5.5 on multiple long-horizon coding benchmarks for 1/6th the cost." https://venturebeat.com/technology/z-ais-open-weights-glm-5-2-beats-gpt-5-5-on-multiple-long-horizon-coding-benchmarks-for-1-6th-the-cost — 独立系のコーディング比較とコストの枠組み。
- LetsDataScience. (2026). "GLM-5.2 open weights beats GPT-5.5 coding." https://letsdatascience.com/blog/glm-5-2-open-weights-beats-gpt-5-5-coding — コーディング結果に関する独立系の報道。