一天之内，智谱和 Anthropic 都发了最强编程模型

日期：2025-10-14 | 栏目：专题专栏 | 浏览：1,025

1、

假期前最后一天（9月30日），热闹非凡。

上午，Anthropic 公司发布了 Claude Sonnet 4.5 模型。

下午，智谱公司发布了 GLM 4.6 模型。

我觉得，对于程序员，这个动态很重要。

因为这两个模型都属于目前最先进的 AI 编程模型。你想让 AI 生成代码，首选就是它们。

这就是说，一天之内，AI 编程模型又达到了新高度。

2、

Anthropic 发布公告的第一句话，就毫不谦虚地用了三个"世界之最"。

"Claude Sonnet 4.5 是世界上最好的编码模型。它是构建复杂代理的最强大模型。它是使用计算机的最佳模型。它在推理和数学方面表现出显著的进步。"

智谱的发布公告也是当仁不让。

"我们再次突破大模型的能力边界。

GLM-4.6是我们最强的代码 Coding 模型（较 GLM-4.5 提升27%）。在真实编程、长上下文处理、推理能力、信息搜索、写作能力与智能体应用等多个方面实现全面提升。"

为了让人信服，智谱的发布公告还给出了详细的测试结果。

上图一共是8个测试基准的结果图。每个图的蓝柱是 GLM-4.6，绿柱是 GLM-4.5。对照组是前两天刚发布的 DeepSeek V3.2 Exp、Claude sonnet 4、Claude sonnet 4.5。

可以看到，蓝柱基本上都是排名前列，甚至第一。智谱还声称，GLM-4.6 非常节省 Token（也就是省钱），"比 GLM-4.5 节省30%以上，为同类模型最低"。

所以，它的结论就是："GLM-4.6 在部分榜单表现对齐 Claude Sonnet 4/Claude Sonnet 4.5，稳居国产模型首位。"

这就有意思了，一个自称"世界上最好的编码模型"，另一个自称"稳居国产模型首位"。

下面，我来测试，GLM-4.6 相比 Claude sonnet 4.5 到底怎么样。

3、

需要说明的是，这两个模型的比较，不完全是为了测试，也有实际的意义。

Anthropic 公司虽然产品很强，但是它限制中国人使用，国内用户正常途径无法开通它的服务。另一方面，它是付费模型，价格也不便宜，百万 token 的输入输出价格是3美元/15美元。

形成鲜明对照的是，GLM-4.6 是完完全全的国产模型，来自北京智谱公司。它采取彻底的开源路线（MIT 许可证），模型代码完全公开，可以任意使用。

你要想自己在家里安装，也是可以的。但是，它的硬件要求太高，家用设备达不到，所以，一般都使用它的云服务。

目前，智谱的官网（BigModel 和 Z.ai），通过 Web 界面使用 GLM-4.6 是免费的。

它的 API 调用需要付费，入门套餐（coding plan）好像是一个月20元人民币。

另外，它有完备的中文支持（文档+客服），这也是 Anthropic 没有的。

总之，我的测试目的，也是想看看，它是不是真如官方宣称的那样强大，能不能替代 Claude Sonnet 模型。