Key Takeaways
- #1 open-weights, 4º general. GLM-5.2 puntúa 51 en el Artificial Analysis Intelligence Index v4.1: el mejor modelo open-weights, 4º general, +11 sobre GLM-5.1 (40), y ~7 puntos por encima de los siguientes modelos abiertos, MiniMax-M3 (44) y DeepSeek V4 Pro (44).
- Lidera los open-weights, no todo el campo. Se sitúa unos 5 puntos por debajo de Claude Fable 5 y queda por detrás de la frontera cerrada en general. "Acorta la distancia", no "supera la frontera".
- Fuerte en programación, segundo tras Opus 4.8. Los resultados de programación independientes ponen a GLM-5.2 por delante de GPT-5.5 pero por detrás de Claude Opus 4.8 en la mayoría de comparativas directas.
- ~744B parámetros no es ejecutable en casa. Es Mixture-of-Experts (~40B activos por token), pero el modelo completo necesita multi-GPU o una GPU alquilada; solo las builds GGUF de 1-bit muy cuantizadas caben en hardware de consumo.
- Los pesos self-hosted protegen tus datos; la API de Z.ai no necesariamente. Los pesos con licencia MIT se ejecutan dentro de tu perímetro; la API de Z.ai de primera parte conlleva consideraciones de residencia de datos en China.
- Trata los propios benchmarks de Z.ai como reportados por la empresa. La reproducibilidad está en disputa: guíate por las cifras independientes de Artificial Analysis.
¿Qué es GLM-5.2?
GLM-5.2 es un modelo de lenguaje open-weights lanzado el 13 de junio de 2026 por Z.ai (antes Zhipu AI), bajo la licencia MIT sin límites regionales de uso. Se sometió a benchmarks públicos desde el 16 de junio de 2026.
- ~744B parámetros totales (las fuentes citan entre 743B y 753B), usando una arquitectura Mixture-of-Experts con ~40B parámetros activos por token.
- Ventana de contexto de 1M tokens con una salida máxima de 131,072 tokens.
- ~43,000 tokens de salida por tarea de media, frente a los ~26,000 de GLM-5.1, lo que aumenta el tiempo y el coste de la inferencia local.
- Licencia MIT: gratis para descargar, hacer self-hosting y modificar, sin restricciones regionales.
¿Qué tan bueno es GLM-5.2? Primero los benchmarks independientes
En la única clasificación independiente y multivendedor —el Artificial Analysis Intelligence Index v4.1— GLM-5.2 es el modelo open-weights más alto con 51 puntos, 4º general (Artificial Analysis, junio de 2026).
| Modelo | Index v4.1 | Categoría |
|---|---|---|
| Claude Fable 5 | ~56 | Frontera cerrada |
| GLM-5.2 | 51 | #1 open-weights / 4º general |
| MiniMax-M3 | 44 | Open-weights |
| DeepSeek V4 Pro | 44 | Open-weights |
| GLM-5.1 (anterior) | 40 | Open-weights |
Resultados de programación independientes: Terminal-Bench 2.1 — GLM-5.2 puntúa 81.0 frente a Claude Opus 4.8 con 85.0. SWE-bench Pro — GLM-5.2 con 62.1 (valor reportado por Z.ai) se sitúa por delante del 58.6 de GPT-5.5; la cobertura independiente corrobora ese orden. FrontierSWE — GLM-5.2 con 74.4 (valor reportado por Z.ai) supera a GPT-5.5 (72.6) y queda por detrás de Opus 4.8 (75.1) por cerca de un punto, un orden que la cobertura independiente confirma. Veredicto independiente neto: GLM-5.2 es el modelo de programación de código abierto más fuerte disponible a junio de 2026, pero aún queda por detrás de Claude Opus 4.8 en la mayoría de comparativas directas (VentureBeat; letsdatascience, junio de 2026).
Las cifras de la propia Z.ai frente a los resultados independientes: léelas con cuidado
Varias cifras destacadas provienen de las propias evaluaciones de Z.ai y deben leerse como reportadas por la empresa, no verificadas de forma independiente.
- Las cifras de programación reportadas por la empresa —por ejemplo MCP-Atlas 77.0 (reportado por Z.ai), frente a GPT-5.5 con 75.3 y Opus 4.8 con 77.8— las ejecuta la propia Z.ai y deben tratarse como afirmaciones a la espera de una réplica independiente.
- El análisis de Artificial Analysis señala que las evaluaciones internas de Z.ai se reportaron más débiles que sus benchmarks publicados, y la reproducibilidad está en disputa.
- La reproducibilidad es una incógnita. Al menos un comentarista destacado describe el modelo como "bench-maxxed", y GLM-5.1 supuestamente puntuó un 0% en al menos un benchmark en el que GLM-5.2 ahora rinde bien. El Artificial Analysis Index independiente —no la propia suite de Z.ai— es lo que actualmente respalda la afirmación de ser el nº1 open-weights.
¿Puedes ejecutar GLM-5.2 en casa? La realidad de los ~744B
No, no el modelo completo. "Open weights" y "self-hostable" no significan "se ejecuta en un PC doméstico típico".
- El GLM-5.2 completo necesita infraestructura seria: servidores multi-GPU o una GPU en la nube alquilada.
- En hardware de consumo, solo son viables las builds GGUF de 1-bit muy cuantizadas, con concesiones en calidad y velocidad.
- La alta salida de ~43,000 tokens por tarea aumenta aún más el tiempo y el coste locales.
- Para la realidad de hardware de los modelos locales grandes, consulta Ejecutar modelos de 70B en hardware de consumo, GPUs usadas para LLMs locales, la Guía de hardware para LLMs locales 2026 y Apple Silicon M5 para LLMs locales.
Pesos self-hosted frente a la API de Z.ai: a dónde van tus datos
La licencia y la API son dos historias distintas de gobernanza de datos. Los pesos MIT self-hosted mantienen tus datos dentro de tu perímetro; la API de Z.ai de primera parte no.
- Self-hosted (pesos MIT): los datos permanecen locales y tuyos, sin transmisión a terceros.
- API de primera parte de Z.ai: la cobertura independiente señala explícitamente consideraciones de residencia de datos en China ("China data risk") en la ruta de la API (TechTimes, 17 de junio de 2026).
- Marco de decisión: si la sensibilidad de los datos importa, haz self-hosting de los pesos; si usas la API alojada, trátala como tratarías cualquier endpoint en la nube de terceros sujeto a su jurisdicción.
Precio y coste de GLM-5.2
Vía la API alojada, GLM-5.2 cuesta aproximadamente un sexto del coste de los modelos de frontera cerrada (VentureBeat, junio de 2026). El precio reportado es de aproximadamente $1.4 por 1M de tokens de entrada y $4.4 por 1M de tokens de salida (a junio de 2026). Ten en cuenta la alta salida por tarea (~43,000 tokens) al estimar el coste real de la carga de trabajo.
¿Deberías usar GLM-5.2?
Guía de decisión de GLM-5.2
Use a local LLM if:
- •Quieres el modelo open-weights más fuerte disponible ahora mismo
- •Necesitas self-hosting y control de datos dentro de tu propio perímetro
- •Ejecutas tareas de programación de horizonte largo
- •Quieres calidad cercana a la frontera a aproximadamente un sexto del coste
Use a cloud model if:
- •Necesitas la puntuación máxima en comparativas directas de programación o razonamiento
- •No requieres open weights y prefieres un modelo de frontera cerrada como Claude Opus 4.8
- •No puedes aprovisionar infraestructura multi-GPU o de GPU alquilada
Quick decision:
- →La mejor opción open-weights hoy, pero verifica los benchmarks en disputa con tus propias tareas antes de comprometerte.
GLM-5.2: contexto regional
UE / GDPR: Hacer self-hosting de GLM-5.2 bajo la licencia MIT mantiene todos los datos de inferencia dentro de tu propia infraestructura, lo que satisface las expectativas de residencia de datos bajo el GDPR. La diferencia de cumplimiento entre modelos está en la documentación del proveedor, no en el tratamiento de datos, cuando la inferencia se ejecuta localmente.
Japón (METI): Para despliegues de producción, documenta la versión del modelo (GLM-5.2), la licencia (MIT), y si la inferencia se ejecuta sobre pesos self-hosted o la API de Z.ai, en línea con las directrices de gobernanza de IA del METI.
China / ruta de datos: GLM-5.2 está construido por un laboratorio chino. La palanca de cumplimiento clave es la ruta de despliegue, no el modelo: los pesos MIT self-hosted mantienen los datos en tu perímetro, mientras que la API de primera parte de Z.ai está sujeta a su jurisdicción de origen. Elige la ruta que se ajuste a tus requisitos de residencia de datos.
Errores comunes al evaluar GLM-5.2
- Asumir que "open weights" significa "se ejecuta en casa". El tamaño de ~744B requiere infraestructura multi-GPU o alquilada; solo las builds GGUF de 1-bit caben en hardware de consumo.
- Tratar los benchmarks de primera parte de Z.ai como verificados. Guíate por el Artificial Analysis Index independiente; trata las cifras de programación de la empresa como afirmaciones.
- Confundir los pesos MIT con la API alojada para la gobernanza de datos. El self-hosting mantiene los datos locales; la API está sujeta a su jurisdicción de origen.
- Leer "#1 open weights" como "supera la frontera". GLM-5.2 es 4º general y queda por detrás de Claude Opus 4.8 en la mayoría de comparativas directas.
- Ignorar la salida de ~43,000 tokens por tarea al presupuestar el tiempo y el coste de la inferencia.
Preguntas frecuentes
¿Es GLM-5.2 el mejor modelo open-weights ahora mismo?
Según el Artificial Analysis Intelligence Index v4.1 independiente (junio de 2026), sí: GLM-5.2 puntúa 51, el mejor resultado open-weights y 4º general. Lidera a los siguientes modelos abiertos, MiniMax-M3 y DeepSeek V4 Pro (ambos 44), por cerca de 7 puntos. Sin embargo, no supera a la frontera cerrada en general.
¿Puedo ejecutar GLM-5.2 en un PC o Mac normal?
No el modelo completo. Con ~744B parámetros necesita servidores multi-GPU o una GPU en la nube alquilada. En hardware de consumo estás limitado a builds GGUF de 1-bit muy cuantizadas, que sacrifican calidad y velocidad. Consulta nuestras guías de hardware para saber qué requieren realmente los modelos locales grandes.
¿GLM-5.2 supera a GPT-5.5 y a Claude Opus 4.8?
En programación, los resultados independientes ponen a GLM-5.2 por delante de GPT-5.5 (por ejemplo, los órdenes de SWE-bench Pro y FrontierSWE). Frente a Claude Opus 4.8 queda por detrás en la mayoría de comparativas directas: por ejemplo Terminal-Bench 2.1 (81.0 frente a 85.0) y FrontierSWE (cerca de un punto por detrás). El resumen preciso es "lidera los open weights, acorta la distancia con la frontera", no "supera la frontera".
¿GLM-5.2 es realmente gratis? ¿Cuál es la licencia?
GLM-5.2 se lanza bajo la licencia MIT sin límites regionales de uso, así que puedes descargarlo, hacerle self-hosting y modificarlo gratis. Ejecutar el modelo completo aún cuesta infraestructura real (multi-GPU o GPU alquilada), y la API alojada de Z.ai es un servicio de pago.
¿Están seguros mis datos con GLM-5.2?
Depende de la ruta de despliegue. Los pesos MIT self-hosted mantienen todos los datos dentro de tu propio perímetro. La API de primera parte de Z.ai conlleva consideraciones de residencia de datos en China señaladas por la cobertura independiente, así que trátala como tratarías cualquier endpoint en la nube de terceros sujeto a su jurisdicción.
¿Son fiables las cifras de benchmark de GLM-5.2?
El Artificial Analysis Index independiente corrobora la clasificación de nº1 open-weights. Las propias cifras de programación de Z.ai son reportadas por la empresa, y la reproducibilidad está en disputa: el análisis de Artificial Analysis señala que las evaluaciones internas se reportaron más débiles que los benchmarks publicados. Guíate por las cifras independientes y trata las cifras de primera parte como afirmaciones.
¿Cuánto cuesta ejecutar GLM-5.2 vía API?
Aproximadamente un sexto del coste de los modelos de frontera cerrada. El precio reportado es de aproximadamente $1.4 por 1M de tokens de entrada y $4.4 por 1M de tokens de salida (junio de 2026). Como GLM-5.2 promedia ~43,000 tokens de salida por tarea, estima el coste real sobre tu propia carga de trabajo en lugar de basarte solo en las tarifas por token.
¿Qué hardware necesito para hacer self-hosting de GLM-5.2 correctamente?
Para el modelo completo, servidores multi-GPU o una GPU en la nube alquilada. El hardware de consumo solo puede ejecutar builds GGUF de 1-bit muy cuantizadas. Consulta la Guía de hardware para LLMs locales 2026, GPUs usadas para LLMs locales y Ejecutar modelos de 70B en hardware de consumo para dimensionar tu configuración.
Fuentes
- Artificial Analysis. (2026). "GLM-5.2 is the new leading open-weights model on the Artificial Analysis Intelligence Index." https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index — Clasificación independiente del Intelligence Index v4.1 (51, #1 abierto / 4º general).
- TechTimes. (2026, 17 de junio). "GLM-5.2 open weights live, tops coding benchmark; API use carries China data risk." https://www.techtimes.com/articles/318543/20260617/glm-52-open-weights-live-top-coding-benchmark-api-use-carries-china-data-risk.htm — Consideraciones de residencia de datos en la ruta de la API de Z.ai.
- VentureBeat. (2026). "Z.ai's open-weights GLM-5.2 beats GPT-5.5 on multiple long-horizon coding benchmarks for 1/6th the cost." https://venturebeat.com/technology/z-ais-open-weights-glm-5-2-beats-gpt-5-5-on-multiple-long-horizon-coding-benchmarks-for-1-6th-the-cost — Comparativa de programación independiente y marco de costes.
- LetsDataScience. (2026). "GLM-5.2 open weights beats GPT-5.5 coding." https://letsdatascience.com/blog/glm-5-2-open-weights-beats-gpt-5-5-coding — Cobertura independiente de los resultados de programación.