Accueil/LLMs locaux/GLM-5.2 : le modèle open-weights n°1 de 2026 (et pourquoi il ne tournera pas chez vous)

Best Models

GLM-5.2 : le modèle open-weights n°1 de 2026 (et pourquoi il ne tournera pas chez vous)

Dernière mise à jour: juin 2026·9 min de lecture·Par Hans Kuepper · Fondateur de PromptQuorum, outil de dispatch multi-modèle · PromptQuorum

Lire en:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

GLM-5.2, publié le 13 juin 2026 par Z.ai (anciennement Zhipu AI), est le LLM open-weights le mieux classé sur l'Artificial Analysis Intelligence Index v4.1 — 51 points, n°1 des modèles ouverts et 4e au général. Il domine l'open-weights ; il ne dépasse pas la frontière fermée. Et à ~744B de paramètres, « ouvert et auto-hébergeable » ne veut pas dire « tourne sur votre ordinateur portable ».

GLM-5.2, publié le 13 juin 2026 par Z.ai (anciennement Zhipu AI), est le modèle de langage open-weights le mieux classé sur l'Artificial Analysis Intelligence Index v4.1 indépendant — 51 points, n°1 des modèles ouverts et 4e au classement général. Il dépasse GPT-5.5 sur les benchmarks de code mais reste derrière Claude Opus 4.8 dans la plupart des comparaisons directes. Cet article distingue les résultats indépendants des affirmations de Z.ai, et explique pourquoi un modèle ouvert d'environ 744B de paramètres ne s'exécute pas chez vous.

Points clés

N°1 open-weights, 4e au général. GLM-5.2 obtient 51 sur l'Artificial Analysis Intelligence Index v4.1 — le meilleur modèle open-weights, 4e au général, +11 par rapport à GLM-5.1 (40), et ~7 points devant les modèles ouverts suivants, MiniMax-M3 (44) et DeepSeek V4 Pro (44).
Il domine l'open-weights, pas tout le champ. Il se situe environ 5 points sous Claude Fable 5 et se classe derrière la frontière fermée au général. « Réduit l'écart » — pas « dépasse la frontière ».
Solide sur le code, second derrière Opus 4.8. Les résultats de code indépendants placent GLM-5.2 devant GPT-5.5 mais derrière Claude Opus 4.8 dans la plupart des comparaisons directes.
~744B de paramètres ne s'exécute pas chez soi. C'est une architecture Mixture-of-Experts (~40B actifs par token), mais le modèle complet exige du multi-GPU ou un GPU loué ; seules les versions GGUF 1-bit fortement quantifiées tiennent sur du matériel grand public.
Les poids auto-hébergés gardent vos données ; pas nécessairement l'API Z.ai. Les poids sous licence MIT s'exécutent dans votre périmètre ; l'API Z.ai officielle soulève des considérations de résidence des données en Chine.
Traitez les propres benchmarks de Z.ai comme déclarés par l'éditeur. La reproductibilité est contestée — privilégiez les chiffres indépendants d'Artificial Analysis.

Qu'est-ce que GLM-5.2 ?

GLM-5.2 est un grand modèle de langage open-weights publié le 13 juin 2026 par Z.ai (anciennement Zhipu AI), sous licence MIT sans limite d'usage régionale. Il est benchmarké publiquement depuis le 16 juin 2026.

~744B de paramètres au total (les sources citent 743B–753B), avec une architecture Mixture-of-Experts comptant ~40B de paramètres actifs par token.
Fenêtre de contexte de 1M de tokens avec une sortie maximale de 131 072 tokens.
~43 000 tokens de sortie par tâche en moyenne — contre ~26 000 pour GLM-5.1 — ce qui augmente le temps et le coût d'inférence locale.
Licence MIT : téléchargement, auto-hébergement et modification gratuits, sans restriction régionale.

GLM-5.2 est-il bon ? D'abord les benchmarks indépendants

Sur le seul classement indépendant et inter-fournisseurs — l'Artificial Analysis Intelligence Index v4.1 — GLM-5.2 est le meilleur modèle open-weights à 51 points, 4e au général (Artificial Analysis, juin 2026).

Modèle	Index v4.1	Niveau
Claude Fable 5	~56	Frontière fermée
GLM-5.2	51	N°1 open-weights / 4e au général
MiniMax-M3	44	Open-weights
DeepSeek V4 Pro	44	Open-weights
GLM-5.1 (précédent)	40	Open-weights

Résultats de code indépendants : Terminal-Bench 2.1 — GLM-5.2 obtient 81.0 contre 85.0 pour Claude Opus 4.8. SWE-bench Pro — GLM-5.2 à 62.1 (valeur déclarée par Z.ai) devance GPT-5.5 à 58.6 ; la couverture indépendante confirme cet ordre. FrontierSWE — GLM-5.2 à 74.4 (valeur déclarée par Z.ai) bat GPT-5.5 (72.6) et reste derrière Opus 4.8 (75.1) d'environ un point, un ordre confirmé par la couverture indépendante. Verdict indépendant net : GLM-5.2 est le modèle de code open-source le plus solide disponible en juin 2026, mais il reste derrière Claude Opus 4.8 dans la plupart des comparaisons directes (VentureBeat ; letsdatascience, juin 2026).

Les chiffres de Z.ai vs les résultats indépendants : à lire avec prudence

Plusieurs chiffres phares proviennent des propres évaluations de Z.ai et doivent être lus comme déclarés par l'éditeur, non vérifiés de manière indépendante.

Les chiffres de code déclarés par l'éditeur — par exemple MCP-Atlas 77.0 (déclaré par Z.ai), contre 75.3 pour GPT-5.5 et 77.8 pour Opus 4.8 — sont mesurés par Z.ai elle-même et doivent être traités comme des affirmations en attente de réplication indépendante.
Le compte-rendu d'Artificial Analysis note que les évaluations internes de Z.ai étaient rapportées plus faibles que ses benchmarks publiés, et la reproductibilité est contestée.
La reproductibilité reste une question ouverte. Au moins un commentateur reconnu qualifie le modèle de « bench-maxxed », et GLM-5.1 aurait obtenu 0 % sur au moins un benchmark où GLM-5.2 réussit désormais bien. C'est l'Artificial Analysis Index indépendant — pas la suite de Z.ai — qui soutient actuellement la revendication du n°1 open-weights.

Pouvez-vous exécuter GLM-5.2 chez vous ? La réalité des ~744B

Non — pas le modèle complet. « Open-weights » et « auto-hébergeable » ne veulent pas dire « tourne sur un PC domestique classique ».

GLM-5.2 complet exige une infrastructure sérieuse : serveurs multi-GPU ou GPU cloud loué.
Sur du matériel grand public, seules les versions GGUF 1-bit fortement quantifiées sont envisageables, avec des compromis de qualité et de vitesse.
La sortie élevée de ~43 000 tokens par tâche augmente encore le temps et le coût en local.
Pour la réalité matérielle des grands modèles locaux, voir Exécuter des modèles 70B sur du matériel grand public, GPU d'occasion pour LLM locaux, le Guide du matériel pour LLM locaux 2026 et Apple Silicon M5 pour LLM locaux.

Poids auto-hébergés vs API Z.ai : où vont vos données

La licence et l'API racontent deux histoires de gouvernance des données différentes. Les poids MIT auto-hébergés gardent vos données dans votre périmètre ; l'API Z.ai officielle, non.

Auto-hébergé (poids MIT) : les données restent locales et vous appartiennent — aucune transmission à des tiers.
API Z.ai officielle : la couverture indépendante signale explicitement des considérations de résidence des données en Chine (« risque de données en Chine ») sur le chemin de l'API (TechTimes, 17 juin 2026).
Cadre de décision : si la sensibilité des données compte, auto-hébergez les poids ; si vous utilisez l'API hébergée, traitez-la comme tout point de terminaison cloud tiers soumis à sa juridiction.

Tarification et coût de GLM-5.2

Via l'API hébergée, GLM-5.2 revient à environ un sixième du coût des modèles de frontière fermée (VentureBeat, juin 2026). Le tarif annoncé est d'environ $1.4 par 1M de tokens d'entrée et $4.4 par 1M de tokens de sortie (en juin 2026). Tenez compte de la sortie élevée par tâche (~43 000 tokens) pour estimer le coût réel de votre charge de travail.

Faut-il utiliser GLM-5.2 ?

Guide de décision GLM-5.2

Use a local LLM if:

•Vous voulez le modèle open-weights le plus solide disponible actuellement
•Vous avez besoin d'auto-hébergement et de contrôle des données dans votre propre périmètre
•Vous exécutez des tâches de code à horizon long
•Vous voulez une qualité proche de la frontière pour environ un sixième du coût

Use a cloud model if:

•Vous avez besoin du meilleur score en code ou en raisonnement en comparaison directe
•Vous n'avez pas besoin de poids ouverts et préférez un modèle de frontière fermée comme Claude Opus 4.8
•Vous ne pouvez pas provisionner d'infrastructure multi-GPU ou GPU loué

Quick decision:

→La meilleure option open-weights aujourd'hui — mais vérifiez les benchmarks contestés sur vos propres tâches avant de vous engager.

GLM-5.2 : contexte régional

UE / RGPD : Auto-héberger GLM-5.2 sous licence MIT maintient toutes les données d'inférence dans votre propre infrastructure, ce qui satisfait les attentes de résidence des données au titre du RGPD. La CNIL recommande l'inférence locale pour le traitement des données professionnelles sensibles (financières, médicales, juridiques). La différence de conformité entre modèles tient à la documentation fournisseur, pas au traitement des données, lorsque l'inférence s'exécute localement.

Japon (METI) : Pour les déploiements en production, documentez la version du modèle (GLM-5.2), la licence (MIT) et si l'inférence s'exécute sur des poids auto-hébergés ou via l'API Z.ai, conformément aux orientations de gouvernance de l'IA du METI.

Chine / chemin des données : GLM-5.2 est conçu par un laboratoire chinois. Le levier de conformité clé est le chemin de déploiement, pas le modèle : les poids MIT auto-hébergés gardent les données dans votre périmètre, tandis que l'API Z.ai officielle relève de sa juridiction d'origine. Choisissez le chemin qui correspond à vos exigences de résidence des données.

Erreurs courantes lors de l'évaluation de GLM-5.2

Croire qu'« open-weights » signifie « tourne chez soi ». La taille de ~744B exige du multi-GPU ou une infrastructure louée ; seules les versions GGUF 1-bit tiennent sur du matériel grand public.
Considérer les benchmarks officiels de Z.ai comme vérifiés. Privilégiez l'Artificial Analysis Index indépendant ; traitez les chiffres de code mesurés par l'éditeur comme des affirmations.
Confondre les poids MIT et l'API hébergée pour la gouvernance des données. L'auto-hébergement garde les données en local ; l'API relève de sa juridiction d'origine.
Lire « n°1 open-weights » comme « dépasse la frontière ». GLM-5.2 est 4e au général et reste derrière Claude Opus 4.8 dans la plupart des comparaisons directes.
Ignorer la sortie de ~43 000 tokens par tâche lors de l'estimation du temps et du coût d'inférence.

Questions fréquemment posées

GLM-5.2 est-il le meilleur modèle open-weights actuel ?

Selon l'Artificial Analysis Intelligence Index v4.1 indépendant (juin 2026), oui — GLM-5.2 obtient 51, le meilleur résultat open-weights et 4e au général. Il devance d'environ 7 points les modèles ouverts suivants, MiniMax-M3 et DeepSeek V4 Pro (44 chacun). Il ne dépasse toutefois pas la frontière fermée au général.

Puis-je exécuter GLM-5.2 sur un PC ou un Mac classique ?

Pas le modèle complet. À ~744B de paramètres, il exige des serveurs multi-GPU ou un GPU cloud loué. Sur du matériel grand public, vous êtes limité aux versions GGUF 1-bit fortement quantifiées, au détriment de la qualité et de la vitesse. Consultez nos guides matériels pour ce que les grands modèles locaux exigent réellement.

GLM-5.2 dépasse-t-il GPT-5.5 et Claude Opus 4.8 ?

Sur le code, les résultats indépendants placent GLM-5.2 devant GPT-5.5 (par exemple les ordres SWE-bench Pro et FrontierSWE). Face à Claude Opus 4.8, il reste derrière dans la plupart des comparaisons directes — par exemple Terminal-Bench 2.1 (81.0 contre 85.0) et FrontierSWE (environ un point de retard). Le résumé exact est « domine l'open-weights, réduit l'écart avec la frontière », pas « dépasse la frontière ».

GLM-5.2 est-il vraiment gratuit ? Quelle est la licence ?

GLM-5.2 est publié sous licence MIT sans limite d'usage régionale : vous pouvez le télécharger, l'auto-héberger et le modifier gratuitement. Exécuter le modèle complet coûte tout de même une vraie infrastructure (multi-GPU ou GPU loué), et l'API Z.ai hébergée est un service payant.

Mes données sont-elles en sécurité avec GLM-5.2 ?

Cela dépend du chemin de déploiement. Les poids MIT auto-hébergés gardent toutes les données dans votre propre périmètre. L'API Z.ai officielle soulève des considérations de résidence des données en Chine, signalées par la couverture indépendante ; traitez-la donc comme tout point de terminaison cloud tiers soumis à sa juridiction.

Les chiffres de benchmark de GLM-5.2 sont-ils fiables ?

L'Artificial Analysis Index indépendant confirme le classement n°1 open-weights. Les chiffres de code de Z.ai sont déclarés par l'éditeur et la reproductibilité est contestée — le compte-rendu d'Artificial Analysis note que les évaluations internes étaient rapportées plus faibles que les benchmarks publiés. Privilégiez les chiffres indépendants et traitez les chiffres officiels comme des affirmations.

Combien coûte l'exécution de GLM-5.2 via l'API ?

Environ un sixième du coût des modèles de frontière fermée. Le tarif annoncé est d'environ $1.4 par 1M de tokens d'entrée et $4.4 par 1M de tokens de sortie (juin 2026). Comme GLM-5.2 produit en moyenne ~43 000 tokens de sortie par tâche, estimez le coût réel sur votre propre charge de travail plutôt que sur les seuls tarifs au token.

Quel matériel faut-il pour auto-héberger correctement GLM-5.2 ?

Pour le modèle complet, des serveurs multi-GPU ou un GPU cloud loué. Le matériel grand public ne peut exécuter que des versions GGUF 1-bit fortement quantifiées. Consultez le Guide du matériel pour LLM locaux 2026, GPU d'occasion pour LLM locaux et Exécuter des modèles 70B sur du matériel grand public pour dimensionner votre configuration.

Sources

Artificial Analysis. (2026). « GLM-5.2 is the new leading open-weights model on the Artificial Analysis Intelligence Index. » https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index — Classement indépendant Intelligence Index v4.1 (51, n°1 ouvert / 4e au général).
TechTimes. (2026, 17 juin). « GLM-5.2 open weights live, tops coding benchmark; API use carries China data risk. » https://www.techtimes.com/articles/318543/20260617/glm-52-open-weights-live-top-coding-benchmark-api-use-carries-china-data-risk.htm — Considérations de résidence des données sur le chemin de l'API Z.ai.
VentureBeat. (2026). « Z.ai's open-weights GLM-5.2 beats GPT-5.5 on multiple long-horizon coding benchmarks for 1/6th the cost. » https://venturebeat.com/technology/z-ais-open-weights-glm-5-2-beats-gpt-5-5-on-multiple-long-horizon-coding-benchmarks-for-1-6th-the-cost — Comparaison de code indépendante et cadrage des coûts.
LetsDataScience. (2026). « GLM-5.2 open weights beats GPT-5.5 coding. » https://letsdatascience.com/blog/glm-5-2-open-weights-beats-gpt-5-5-coding — Couverture indépendante des résultats de code.

Note sur les faits tiers

Cet article fait référence à des modèles d’IA, des benchmarks, des prix et des licences de tiers. Le paysage de l’IA évolue rapidement. Les scores de benchmark, les conditions de licence, les noms de modèles et les prix des API peuvent changer entre le moment de la rédaction et le moment où vous lisez ceci. Avant de prendre des décisions de déploiement ou de conformité basées sur cet article, vérifiez les chiffres actuels auprès de la source officielle de chaque fournisseur : fiches de modèles Hugging Face pour les licences et benchmarks, sites web des fournisseurs pour les prix API, et EUR-Lex pour les textes RGPD et AI Act actuels. Cet article reflète les informations publiques disponibles en mai 2026.

Utilisez PromptQuorum avec un LLM local, vos propres clés API, ou les deux — vous choisissez le backend.

Rejoindre la liste d'attente PromptQuorum →

← Retour aux LLMs locaux