大模型扎堆发布，国产模型怎么接？

原创于 2026-06-23 14:43:57 发布 · 172 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#ai #人工智能 #阿里云 #github #AIGC

6 篇文章

订阅专栏

最近，四款旗舰大模型密集发布。OpenAI的GPT-5.6、Anthropic的Claude、Google的Gemini 3.5 Pro、智谱的GLM-5.2——头部厂商在短短几周内集中推新。

这个密度，在大模型发展史上没有先例。以前是半年一发，现在变成了一周四发。

在这里插入图片描述
OpenAI首席科学家Jakub Pachocki已确认，GPT-5.6将在六月内发布。Polymarket社区预测概率达到83%，发布窗口锁定在6月22至28日。

核心升级有三个方向。

上下文窗口扩至150万Token，比GPT-5.5提升约43%。百万字级的法律文档、大型代码库、企业知识库，可以一次性塞进去，不用再分段处理。

新增Playwright浏览器自动化能力。模型能直接操控真实浏览器，执行点击、输入、跳转等操作。还带了视觉复刻Agent，设计稿直接转成可运行代码。编码场景据称已经击败Anthropic的Mythos系列。

定价传闻只有Claude Fable 5的三分之一。叠加Fable 5目前仍处于停服状态，GPT-5.6抢占市场的窗口非常宽。

在这里插入图片描述

ScienceQA平均分76.4，全球首个突破75分的AI模型。SWE-Bench Pro编程基准69.2%，超过GPT-5.5。速度提升2.5倍，价格降了约三分之二。Claude Code年化收入接近63亿美元，在AI编程Agent赛道拿下54%的市场份额。

Anthropic最新估值9650亿美元，首次超过OpenAI。

同时，Anthropic被曝已完成Claude Sonnet 5的训练，最快下周发布，支持100万Token上下文。此前被美国政府强制下线的Fable 5也疑似复活，重新出现在Claude安卓版模型选择器中。

一款已发，一款待发，一款复活。节奏明显在加速。

Google的Gemini 3.5 Flash已经面向所有用户免费开放，性能超过前代3.1 Pro，支持200万Token超长上下文——目前免费模型中性能最强的选择。

Gemini 3.5 Pro GA版本预计六月下旬更新，与GPT-5.6正面交锋。Google同时宣布投入1800亿美元布局AI基础设施。

1800亿这个数字，说明Google不打算在模型竞赛中掉队。

在这里插入图片描述
智谱的GLM-5.2在全球权威大模型榜单排名第四，代码和长文本能力对标海外头部模型。智谱港交所上市后年内股价暴涨2076%，总市值突破1万亿港元，成为中国首个万亿级AI公司。

国产模型不再是追赶者的角色。科创板第五套标准扩容至AI大模型领域后，国产模型厂商的资本通道也正式打开。DeepSeek、MiniMax都在排队冲刺上市。

国产模型和海外头部的差距，正在快速收窄。

Qwen的代码生成已经稳定可用，DeepSeek的推理能力在多轮基准测试中进入前列，Kimi的长文本处理一直是优势，GLM-5.2的综合能力排进全球第四。MiniMax在多模态和短视频生成场景也表现突出。

对于大多数国内应用场景，这些模型已经够用了。

但问题是，够用的模型变多了，接口反而更碎了。

用DeepSeek跑推理，用Qwen写代码，用Kimi处理长文档——意味着三个平台、三套API、三种计费规则、三种限流策略。每个平台都在发新版本，每次升级都要重新看文档、改代码、调测试。

模型能力在趋同，开发者的对接成本在上涨。

海外旗舰发布再多，真正落到国内业务里，还是国产模型更顺手。网络稳定、合规明确、响应速度快，价格也更透明。

但顺手不等于省心。模型越多，选择越麻烦，接口切换越频繁。

器灵模型广场就是冲着这个麻烦来的。一个入口聚合Qwen、DeepSeek、Kimi、GLM、MiniMax、万象等国产主流模型，多模型API切换不用换接口；通过大模型路由分配自动把请求送到最合适的模型；作为AI负载均衡平台，某家限流或宕机时自动切到备用。

最主要的是省钱。Token按量计费，全网最低价，比逐个对接各家官方API省一大截。

模型竞赛是厂商的事。开发者该做的，是少花点时间在接口适配上，多留点时间在业务上。
在这里插入图片描述