Key Takeaways
- 1º em pesos abertos, 4º no geral. O GLM-5.2 pontua 51 no Artificial Analysis Intelligence Index v4.1 — o melhor modelo de pesos abertos, 4º no geral, +11 sobre o GLM-5.1 (40), e cerca de 7 pontos à frente dos próximos modelos abertos, MiniMax-M3 (44) e DeepSeek V4 Pro (44).
- Ele lidera os pesos abertos, não o campo inteiro. Fica cerca de 5 pontos abaixo do Claude Fable 5 e atrás da fronteira fechada no geral. "Diminui a distância" — não "supera a fronteira".
- Forte em programação, segundo atrás do Opus 4.8. Resultados independentes de programação colocam o GLM-5.2 à frente do GPT-5.5, mas atrás do Claude Opus 4.8 na maioria das comparações diretas.
- ~744B de parâmetros não roda em casa. É Mixture-of-Experts (~40B ativos por token), mas o modelo completo precisa de multi-GPU ou de uma GPU alugada; apenas builds GGUF fortemente quantizadas de 1 bit cabem em hardware de consumo.
- Os pesos auto-hospedados mantêm seus dados; a API da Z.ai não necessariamente. Os pesos licenciados sob MIT rodam dentro do seu perímetro; a API própria da Z.ai envolve considerações de residência de dados na China.
- Trate os próprios benchmarks da Z.ai como reportados pela empresa. A reprodutibilidade é contestada — priorize os números independentes da Artificial Analysis.
O que é o GLM-5.2?
O GLM-5.2 é um grande modelo de linguagem de pesos abertos lançado em 13 de junho de 2026 pela Z.ai (antiga Zhipu AI), sob a licença MIT e sem limites regionais de uso. Ele passou por benchmarks públicos a partir de 16 de junho de 2026.
- ~744B de parâmetros totais (as fontes citam de 743B a 753B), usando uma arquitetura Mixture-of-Experts com ~40B de parâmetros ativos por token.
- Janela de contexto de 1M de tokens com uma saída máxima de 131.072 tokens.
- ~43.000 tokens de saída por tarefa em média — acima dos ~26.000 do GLM-5.1 — o que aumenta o tempo e o custo da inferência local.
- Licença MIT: gratuito para baixar, auto-hospedar e modificar, sem restrições regionais.
Quão bom é o GLM-5.2? Os benchmarks independentes primeiro
No único ranking independente e entre fornecedores — o Artificial Analysis Intelligence Index v4.1 — o GLM-5.2 é o modelo de pesos abertos com a maior pontuação, 51 pontos, 4º no geral (Artificial Analysis, junho de 2026).
| Modelo | Index v4.1 | Categoria |
|---|---|---|
| Claude Fable 5 | ~56 | Fronteira fechada |
| GLM-5.2 | 51 | 1º em pesos abertos / 4º no geral |
| MiniMax-M3 | 44 | Pesos abertos |
| DeepSeek V4 Pro | 44 | Pesos abertos |
| GLM-5.1 (anterior) | 40 | Pesos abertos |
Resultados independentes de programação: Terminal-Bench 2.1 — o GLM-5.2 pontua 81.0 contra 85.0 do Claude Opus 4.8. SWE-bench Pro — o GLM-5.2 com 62.1 (valor reportado pela Z.ai) fica à frente dos 58.6 do GPT-5.5; a cobertura independente corrobora essa ordenação. FrontierSWE — o GLM-5.2 com 74.4 (valor reportado pela Z.ai) supera o GPT-5.5 (72.6) e fica atrás do Opus 4.8 (75.1) por cerca de um ponto, uma ordenação que a cobertura independente confirma. Veredito independente líquido: o GLM-5.2 é o modelo de programação de código aberto mais forte disponível em junho de 2026, mas ainda fica atrás do Claude Opus 4.8 na maioria das comparações diretas (VentureBeat; letsdatascience, junho de 2026).
Os próprios números da Z.ai vs os resultados independentes: leia com cuidado
Várias cifras de destaque vêm das próprias avaliações da Z.ai e devem ser lidas como reportadas pela empresa, não verificadas de forma independente.
- Cifras de programação reportadas pela empresa — por exemplo, MCP-Atlas 77.0 (reportado pela Z.ai), contra 75.3 do GPT-5.5 e 77.8 do Opus 4.8 — são executadas pela própria Z.ai e devem ser tratadas como alegações pendentes de replicação independente.
- O artigo da Artificial Analysis observa que as avaliações internas da Z.ai foram reportadas como mais fracas do que seus benchmarks publicados, e a reprodutibilidade é contestada.
- A reprodutibilidade é uma questão em aberto. Pelo menos um comentarista de destaque caracteriza o modelo como "bench-maxxed", e o GLM-5.1 teria pontuado 0% em pelo menos um benchmark no qual o GLM-5.2 agora vai bem. O Artificial Analysis Index independente — e não a própria suíte da Z.ai — é o que atualmente sustenta a alegação de nº 1 em pesos abertos.
Dá para rodar o GLM-5.2 em casa? O teste de realidade dos ~744B
Não — não o modelo completo. "Pesos abertos" e "auto-hospedável" não significam "roda num PC doméstico comum".
- O GLM-5.2 completo precisa de infraestrutura robusta: servidores multi-GPU ou uma GPU em nuvem alugada.
- Em hardware de consumo, apenas builds GGUF fortemente quantizadas de 1 bit são viáveis, com perdas de qualidade e velocidade.
- A alta saída de ~43.000 tokens por tarefa eleva ainda mais o tempo e o custo local.
- Para a realidade de hardware dos grandes modelos locais, veja Rodando modelos 70B em hardware de consumo, GPUs usadas para LLMs locais, o Guia de hardware para LLM local 2026 e Apple Silicon M5 para LLMs locais.
Pesos auto-hospedados vs a API da Z.ai: para onde vão seus dados
A licença e a API são duas histórias diferentes de governança de dados. Os pesos MIT auto-hospedados mantêm seus dados dentro do seu perímetro; a API própria da Z.ai não.
- Auto-hospedado (pesos MIT): os dados ficam locais e são seus — sem transmissão a terceiros.
- API própria da Z.ai: a cobertura independente sinaliza explicitamente considerações de residência de dados na China ("risco de dados na China") no caminho da API (TechTimes, 17 de junho de 2026).
- Enquadramento da decisão: se a sensibilidade dos dados importa, auto-hospede os pesos; se você usar a API hospedada, trate-a como qualquer endpoint de nuvem de terceiros sujeito à sua jurisdição.
Preços e custo do GLM-5.2
Via a API hospedada, o GLM-5.2 custa cerca de um sexto do preço dos modelos de fronteira fechada (VentureBeat, junho de 2026). O preço reportado é de aproximadamente $1.4 por 1M de tokens de entrada e $4.4 por 1M de tokens de saída (em junho de 2026). Considere a alta saída por tarefa (~43.000 tokens) ao estimar o custo real de uma carga de trabalho.
Você deveria usar o GLM-5.2?
Guia de decisão do GLM-5.2
Use a local LLM if:
- •Você quer o modelo de pesos abertos mais forte disponível neste momento
- •Você precisa de auto-hospedagem e controle de dados dentro do seu próprio perímetro
- •Você executa tarefas de programação de longo horizonte
- •Você quer qualidade próxima da fronteira por cerca de um sexto do custo
Use a cloud model if:
- •Você precisa da maior pontuação em confrontos diretos de programação ou raciocínio
- •Você não exige pesos abertos e prefere um modelo de fronteira fechada como o Claude Opus 4.8
- •Você não consegue provisionar infraestrutura multi-GPU ou de GPU alugada
Quick decision:
- →A melhor opção de pesos abertos hoje — mas verifique os benchmarks contestados nas suas próprias tarefas antes de se comprometer.
GLM-5.2: contexto regional
Brasil / LGPD: Auto-hospedar o GLM-5.2 sob a licença MIT mantém todos os dados de inferência dentro da sua própria infraestrutura, o que atende às expectativas de residência de dados sob a LGPD (Lei Geral de Proteção de Dados). Quando a inferência roda localmente, a diferença de conformidade entre modelos está na documentação do fornecedor, não no tratamento de dados. A ANPD (Autoridade Nacional de Proteção de Dados) é o órgão regulador a considerar ao documentar o tratamento de dados.
Japão (METI): Para implantações em produção, documente a versão do modelo (GLM-5.2), a licença (MIT) e se a inferência roda em pesos auto-hospedados ou na API da Z.ai, em linha com as diretrizes de governança de IA do METI.
China / caminho dos dados: O GLM-5.2 é desenvolvido por um laboratório chinês. A principal alavanca de conformidade é o caminho de implantação, não o modelo: os pesos MIT auto-hospedados mantêm os dados no seu perímetro, enquanto a API própria da Z.ai está sujeita à sua jurisdição de origem. Escolha o caminho que corresponde aos seus requisitos de residência de dados.
Erros comuns ao avaliar o GLM-5.2
- Supor que "pesos abertos" significa "roda em casa". O tamanho de ~744B exige infraestrutura multi-GPU ou alugada; apenas builds GGUF de 1 bit cabem em hardware de consumo.
- Tratar os benchmarks próprios da Z.ai como verificados. Priorize o Artificial Analysis Index independente; trate os números de programação executados pela empresa como alegações.
- Confundir os pesos MIT com a API hospedada na governança de dados. A auto-hospedagem mantém os dados locais; a API está sujeita à sua jurisdição de origem.
- Ler "1º em pesos abertos" como "supera a fronteira". O GLM-5.2 é 4º no geral e fica atrás do Claude Opus 4.8 na maioria dos confrontos diretos.
- Ignorar a saída de ~43.000 tokens por tarefa ao orçar tempo e custo de inferência.
Perguntas frequentes
O GLM-5.2 é o melhor modelo de pesos abertos no momento?
Pelo Artificial Analysis Intelligence Index v4.1 independente (junho de 2026), sim — o GLM-5.2 pontua 51, o melhor resultado em pesos abertos e o 4º no geral. Ele lidera os próximos modelos abertos, MiniMax-M3 e DeepSeek V4 Pro (ambos com 44), por cerca de 7 pontos. No entanto, ele não supera a fronteira fechada no geral.
Dá para rodar o GLM-5.2 em um PC ou Mac comum?
Não o modelo completo. Com ~744B de parâmetros, ele precisa de servidores multi-GPU ou de uma GPU em nuvem alugada. Em hardware de consumo, você fica limitado a builds GGUF fortemente quantizadas de 1 bit, que comprometem qualidade e velocidade. Veja nossos guias de hardware para saber o que os grandes modelos locais realmente exigem.
O GLM-5.2 supera o GPT-5.5 e o Claude Opus 4.8?
Em programação, resultados independentes colocam o GLM-5.2 à frente do GPT-5.5 (por exemplo, nas ordenações de SWE-bench Pro e FrontierSWE). Contra o Claude Opus 4.8, ele fica atrás na maioria dos confrontos diretos — por exemplo, no Terminal-Bench 2.1 (81.0 contra 85.0) e no FrontierSWE (cerca de um ponto atrás). O resumo correto é "lidera os pesos abertos, diminui a distância para a fronteira", não "supera a fronteira".
O GLM-5.2 é realmente gratuito? Qual é a licença?
O GLM-5.2 é lançado sob a licença MIT, sem limites regionais de uso, então você pode baixar, auto-hospedar e modificá-lo gratuitamente. Rodar o modelo completo ainda custa infraestrutura real (multi-GPU ou GPU alugada), e a API hospedada da Z.ai é um serviço pago.
Meus dados estão seguros com o GLM-5.2?
Depende do caminho de implantação. Os pesos MIT auto-hospedados mantêm todos os dados dentro do seu próprio perímetro. A API própria da Z.ai envolve considerações de residência de dados na China sinalizadas pela cobertura independente, então trate-a como qualquer endpoint de nuvem de terceiros sujeito à sua jurisdição.
Os números de benchmark do GLM-5.2 são confiáveis?
O Artificial Analysis Index independente corrobora a classificação de nº 1 em pesos abertos. Os próprios números de programação da Z.ai são reportados pela empresa, e a reprodutibilidade é contestada — o artigo da Artificial Analysis observa que as avaliações internas foram reportadas como mais fracas do que os benchmarks publicados. Priorize os números independentes e trate as cifras próprias como alegações.
Quanto custa rodar o GLM-5.2 via API?
Cerca de um sexto do custo dos modelos de fronteira fechada. O preço reportado é de aproximadamente $1.4 por 1M de tokens de entrada e $4.4 por 1M de tokens de saída (junho de 2026). Como o GLM-5.2 gera em média ~43.000 tokens de saída por tarefa, estime o custo real na sua própria carga de trabalho, em vez de apenas nas taxas por token.
De que hardware preciso para auto-hospedar o GLM-5.2 corretamente?
Para o modelo completo, servidores multi-GPU ou uma GPU em nuvem alugada. O hardware de consumo só consegue rodar builds GGUF fortemente quantizadas de 1 bit. Veja o Guia de hardware para LLM local 2026, GPUs usadas para LLMs locais e Rodando modelos 70B em hardware de consumo para dimensionar sua configuração.
Fontes
- Artificial Analysis. (2026). "GLM-5.2 is the new leading open-weights model on the Artificial Analysis Intelligence Index." https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index — Classificação independente do Intelligence Index v4.1 (51, 1º aberto / 4º no geral).
- TechTimes. (2026, 17 de junho). "GLM-5.2 open weights live, tops coding benchmark; API use carries China data risk." https://www.techtimes.com/articles/318543/20260617/glm-52-open-weights-live-top-coding-benchmark-api-use-carries-china-data-risk.htm — Considerações de residência de dados no caminho da API da Z.ai.
- VentureBeat. (2026). "Z.ai's open-weights GLM-5.2 beats GPT-5.5 on multiple long-horizon coding benchmarks for 1/6th the cost." https://venturebeat.com/technology/z-ais-open-weights-glm-5-2-beats-gpt-5-5-on-multiple-long-horizon-coding-benchmarks-for-1-6th-the-cost — Comparação independente de programação e enquadramento de custo.
- LetsDataScience. (2026). "GLM-5.2 open weights beats GPT-5.5 coding." https://letsdatascience.com/blog/glm-5-2-open-weights-beats-gpt-5-5-coding — Cobertura independente dos resultados de programação.