Skip to main content
PromptQuorumPromptQuorum
Início/LLMs locais/GLM-5.2: o modelo de pesos abertos nº 1 de 2026 (e por que ele ainda não roda em casa)
Best Models

GLM-5.2: o modelo de pesos abertos nº 1 de 2026 (e por que ele ainda não roda em casa)

·9 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

O GLM-5.2, lançado em 13 de junho de 2026 pela Z.ai (antiga Zhipu AI), é a LLM de pesos abertos com a maior pontuação no Artificial Analysis Intelligence Index v4.1 — 51 pontos, 1º entre os modelos abertos e 4º no geral. Ele lidera os pesos abertos; não supera a fronteira fechada. E com ~744B de parâmetros, "aberto e auto-hospedável" não significa "roda no seu notebook".

O GLM-5.2, lançado em 13 de junho de 2026 pela Z.ai (antiga Zhipu AI), é o grande modelo de linguagem de pesos abertos com a maior pontuação no índice independente Artificial Analysis Intelligence Index v4.1 — 51 pontos, ocupando o 1º lugar entre os modelos abertos e o 4º no geral. Ele supera o GPT-5.5 em benchmarks de programação, mas ainda fica atrás do Claude Opus 4.8 na maioria das comparações diretas. Este artigo separa os resultados independentes das próprias alegações da Z.ai e explica por que um modelo aberto de ~744B de parâmetros não é algo que você consiga rodar em casa.

Key Takeaways

  • 1º em pesos abertos, 4º no geral. O GLM-5.2 pontua 51 no Artificial Analysis Intelligence Index v4.1 — o melhor modelo de pesos abertos, 4º no geral, +11 sobre o GLM-5.1 (40), e cerca de 7 pontos à frente dos próximos modelos abertos, MiniMax-M3 (44) e DeepSeek V4 Pro (44).
  • Ele lidera os pesos abertos, não o campo inteiro. Fica cerca de 5 pontos abaixo do Claude Fable 5 e atrás da fronteira fechada no geral. "Diminui a distância" — não "supera a fronteira".
  • Forte em programação, segundo atrás do Opus 4.8. Resultados independentes de programação colocam o GLM-5.2 à frente do GPT-5.5, mas atrás do Claude Opus 4.8 na maioria das comparações diretas.
  • ~744B de parâmetros não roda em casa. É Mixture-of-Experts (~40B ativos por token), mas o modelo completo precisa de multi-GPU ou de uma GPU alugada; apenas builds GGUF fortemente quantizadas de 1 bit cabem em hardware de consumo.
  • Os pesos auto-hospedados mantêm seus dados; a API da Z.ai não necessariamente. Os pesos licenciados sob MIT rodam dentro do seu perímetro; a API própria da Z.ai envolve considerações de residência de dados na China.
  • Trate os próprios benchmarks da Z.ai como reportados pela empresa. A reprodutibilidade é contestada — priorize os números independentes da Artificial Analysis.

O que é o GLM-5.2?

O GLM-5.2 é um grande modelo de linguagem de pesos abertos lançado em 13 de junho de 2026 pela Z.ai (antiga Zhipu AI), sob a licença MIT e sem limites regionais de uso. Ele passou por benchmarks públicos a partir de 16 de junho de 2026.

  • ~744B de parâmetros totais (as fontes citam de 743B a 753B), usando uma arquitetura Mixture-of-Experts com ~40B de parâmetros ativos por token.
  • Janela de contexto de 1M de tokens com uma saída máxima de 131.072 tokens.
  • ~43.000 tokens de saída por tarefa em média — acima dos ~26.000 do GLM-5.1 — o que aumenta o tempo e o custo da inferência local.
  • Licença MIT: gratuito para baixar, auto-hospedar e modificar, sem restrições regionais.

Quão bom é o GLM-5.2? Os benchmarks independentes primeiro

No único ranking independente e entre fornecedores — o Artificial Analysis Intelligence Index v4.1 — o GLM-5.2 é o modelo de pesos abertos com a maior pontuação, 51 pontos, 4º no geral (Artificial Analysis, junho de 2026).

ModeloIndex v4.1Categoria
Claude Fable 5~56Fronteira fechada
GLM-5.2511º em pesos abertos / 4º no geral
MiniMax-M344Pesos abertos
DeepSeek V4 Pro44Pesos abertos
GLM-5.1 (anterior)40Pesos abertos

Resultados independentes de programação: Terminal-Bench 2.1 — o GLM-5.2 pontua 81.0 contra 85.0 do Claude Opus 4.8. SWE-bench Pro — o GLM-5.2 com 62.1 (valor reportado pela Z.ai) fica à frente dos 58.6 do GPT-5.5; a cobertura independente corrobora essa ordenação. FrontierSWE — o GLM-5.2 com 74.4 (valor reportado pela Z.ai) supera o GPT-5.5 (72.6) e fica atrás do Opus 4.8 (75.1) por cerca de um ponto, uma ordenação que a cobertura independente confirma. Veredito independente líquido: o GLM-5.2 é o modelo de programação de código aberto mais forte disponível em junho de 2026, mas ainda fica atrás do Claude Opus 4.8 na maioria das comparações diretas (VentureBeat; letsdatascience, junho de 2026).

Os próprios números da Z.ai vs os resultados independentes: leia com cuidado

Várias cifras de destaque vêm das próprias avaliações da Z.ai e devem ser lidas como reportadas pela empresa, não verificadas de forma independente.

  • Cifras de programação reportadas pela empresa — por exemplo, MCP-Atlas 77.0 (reportado pela Z.ai), contra 75.3 do GPT-5.5 e 77.8 do Opus 4.8 — são executadas pela própria Z.ai e devem ser tratadas como alegações pendentes de replicação independente.
  • O artigo da Artificial Analysis observa que as avaliações internas da Z.ai foram reportadas como mais fracas do que seus benchmarks publicados, e a reprodutibilidade é contestada.
  • A reprodutibilidade é uma questão em aberto. Pelo menos um comentarista de destaque caracteriza o modelo como "bench-maxxed", e o GLM-5.1 teria pontuado 0% em pelo menos um benchmark no qual o GLM-5.2 agora vai bem. O Artificial Analysis Index independente — e não a própria suíte da Z.ai — é o que atualmente sustenta a alegação de nº 1 em pesos abertos.

Dá para rodar o GLM-5.2 em casa? O teste de realidade dos ~744B

Não — não o modelo completo. "Pesos abertos" e "auto-hospedável" não significam "roda num PC doméstico comum".

Pesos auto-hospedados vs a API da Z.ai: para onde vão seus dados

A licença e a API são duas histórias diferentes de governança de dados. Os pesos MIT auto-hospedados mantêm seus dados dentro do seu perímetro; a API própria da Z.ai não.

  • Auto-hospedado (pesos MIT): os dados ficam locais e são seus — sem transmissão a terceiros.
  • API própria da Z.ai: a cobertura independente sinaliza explicitamente considerações de residência de dados na China ("risco de dados na China") no caminho da API (TechTimes, 17 de junho de 2026).
  • Enquadramento da decisão: se a sensibilidade dos dados importa, auto-hospede os pesos; se você usar a API hospedada, trate-a como qualquer endpoint de nuvem de terceiros sujeito à sua jurisdição.

Preços e custo do GLM-5.2

Via a API hospedada, o GLM-5.2 custa cerca de um sexto do preço dos modelos de fronteira fechada (VentureBeat, junho de 2026). O preço reportado é de aproximadamente $1.4 por 1M de tokens de entrada e $4.4 por 1M de tokens de saída (em junho de 2026). Considere a alta saída por tarefa (~43.000 tokens) ao estimar o custo real de uma carga de trabalho.

Você deveria usar o GLM-5.2?

Guia de decisão do GLM-5.2

Use a local LLM if:

  • Você quer o modelo de pesos abertos mais forte disponível neste momento
  • Você precisa de auto-hospedagem e controle de dados dentro do seu próprio perímetro
  • Você executa tarefas de programação de longo horizonte
  • Você quer qualidade próxima da fronteira por cerca de um sexto do custo

Use a cloud model if:

  • Você precisa da maior pontuação em confrontos diretos de programação ou raciocínio
  • Você não exige pesos abertos e prefere um modelo de fronteira fechada como o Claude Opus 4.8
  • Você não consegue provisionar infraestrutura multi-GPU ou de GPU alugada

Quick decision:

  • A melhor opção de pesos abertos hoje — mas verifique os benchmarks contestados nas suas próprias tarefas antes de se comprometer.

GLM-5.2: contexto regional

Brasil / LGPD: Auto-hospedar o GLM-5.2 sob a licença MIT mantém todos os dados de inferência dentro da sua própria infraestrutura, o que atende às expectativas de residência de dados sob a LGPD (Lei Geral de Proteção de Dados). Quando a inferência roda localmente, a diferença de conformidade entre modelos está na documentação do fornecedor, não no tratamento de dados. A ANPD (Autoridade Nacional de Proteção de Dados) é o órgão regulador a considerar ao documentar o tratamento de dados.

Japão (METI): Para implantações em produção, documente a versão do modelo (GLM-5.2), a licença (MIT) e se a inferência roda em pesos auto-hospedados ou na API da Z.ai, em linha com as diretrizes de governança de IA do METI.

China / caminho dos dados: O GLM-5.2 é desenvolvido por um laboratório chinês. A principal alavanca de conformidade é o caminho de implantação, não o modelo: os pesos MIT auto-hospedados mantêm os dados no seu perímetro, enquanto a API própria da Z.ai está sujeita à sua jurisdição de origem. Escolha o caminho que corresponde aos seus requisitos de residência de dados.

Erros comuns ao avaliar o GLM-5.2

  • Supor que "pesos abertos" significa "roda em casa". O tamanho de ~744B exige infraestrutura multi-GPU ou alugada; apenas builds GGUF de 1 bit cabem em hardware de consumo.
  • Tratar os benchmarks próprios da Z.ai como verificados. Priorize o Artificial Analysis Index independente; trate os números de programação executados pela empresa como alegações.
  • Confundir os pesos MIT com a API hospedada na governança de dados. A auto-hospedagem mantém os dados locais; a API está sujeita à sua jurisdição de origem.
  • Ler "1º em pesos abertos" como "supera a fronteira". O GLM-5.2 é 4º no geral e fica atrás do Claude Opus 4.8 na maioria dos confrontos diretos.
  • Ignorar a saída de ~43.000 tokens por tarefa ao orçar tempo e custo de inferência.

Perguntas frequentes

O GLM-5.2 é o melhor modelo de pesos abertos no momento?

Pelo Artificial Analysis Intelligence Index v4.1 independente (junho de 2026), sim — o GLM-5.2 pontua 51, o melhor resultado em pesos abertos e o 4º no geral. Ele lidera os próximos modelos abertos, MiniMax-M3 e DeepSeek V4 Pro (ambos com 44), por cerca de 7 pontos. No entanto, ele não supera a fronteira fechada no geral.

Dá para rodar o GLM-5.2 em um PC ou Mac comum?

Não o modelo completo. Com ~744B de parâmetros, ele precisa de servidores multi-GPU ou de uma GPU em nuvem alugada. Em hardware de consumo, você fica limitado a builds GGUF fortemente quantizadas de 1 bit, que comprometem qualidade e velocidade. Veja nossos guias de hardware para saber o que os grandes modelos locais realmente exigem.

O GLM-5.2 supera o GPT-5.5 e o Claude Opus 4.8?

Em programação, resultados independentes colocam o GLM-5.2 à frente do GPT-5.5 (por exemplo, nas ordenações de SWE-bench Pro e FrontierSWE). Contra o Claude Opus 4.8, ele fica atrás na maioria dos confrontos diretos — por exemplo, no Terminal-Bench 2.1 (81.0 contra 85.0) e no FrontierSWE (cerca de um ponto atrás). O resumo correto é "lidera os pesos abertos, diminui a distância para a fronteira", não "supera a fronteira".

O GLM-5.2 é realmente gratuito? Qual é a licença?

O GLM-5.2 é lançado sob a licença MIT, sem limites regionais de uso, então você pode baixar, auto-hospedar e modificá-lo gratuitamente. Rodar o modelo completo ainda custa infraestrutura real (multi-GPU ou GPU alugada), e a API hospedada da Z.ai é um serviço pago.

Meus dados estão seguros com o GLM-5.2?

Depende do caminho de implantação. Os pesos MIT auto-hospedados mantêm todos os dados dentro do seu próprio perímetro. A API própria da Z.ai envolve considerações de residência de dados na China sinalizadas pela cobertura independente, então trate-a como qualquer endpoint de nuvem de terceiros sujeito à sua jurisdição.

Os números de benchmark do GLM-5.2 são confiáveis?

O Artificial Analysis Index independente corrobora a classificação de nº 1 em pesos abertos. Os próprios números de programação da Z.ai são reportados pela empresa, e a reprodutibilidade é contestada — o artigo da Artificial Analysis observa que as avaliações internas foram reportadas como mais fracas do que os benchmarks publicados. Priorize os números independentes e trate as cifras próprias como alegações.

Quanto custa rodar o GLM-5.2 via API?

Cerca de um sexto do custo dos modelos de fronteira fechada. O preço reportado é de aproximadamente $1.4 por 1M de tokens de entrada e $4.4 por 1M de tokens de saída (junho de 2026). Como o GLM-5.2 gera em média ~43.000 tokens de saída por tarefa, estime o custo real na sua própria carga de trabalho, em vez de apenas nas taxas por token.

De que hardware preciso para auto-hospedar o GLM-5.2 corretamente?

Para o modelo completo, servidores multi-GPU ou uma GPU em nuvem alugada. O hardware de consumo só consegue rodar builds GGUF fortemente quantizadas de 1 bit. Veja o Guia de hardware para LLM local 2026, GPUs usadas para LLMs locais e Rodando modelos 70B em hardware de consumo para dimensionar sua configuração.

Fontes

Nota sobre informações de terceiros

Este artigo faz referência a modelos de IA, benchmarks, preços e licenças de terceiros. O cenário da IA muda rapidamente. Pontuações de benchmark, termos de licença, nomes de modelos e preços de API podem mudar entre o momento em que foi escrito e quando você está lendo. Antes de tomar decisões de implantação ou conformidade com base neste artigo, verifique os dados atuais na fonte oficial de cada fornecedor: fichas de modelos do Hugging Face para licenças e benchmarks, sites dos fornecedores para preços de API e EUR-Lex para o texto atual do GDPR e da Lei de IA da UE. Este artigo reflete informações publicamente disponíveis em maio de 2026.

Run PromptQuorum with a local LLM, your own API keys, or both — you pick the backend.

Join the PromptQuorum Waitlist →

← Back to Local LLMs