前言
自2022年ChatGPT引爆生成式AI浪潮以来,全球大模型行业进入高速迭代周期。海外科技巨头依托先发优势持续夯实通用大模型底座,国内大厂立足中文场景、国产化算力与行业落地需求,快速补齐技术短板,形成了国内外双线并行、差异化竞争的行业格局。
对于开发者、AI从业者以及普通用户而言,市面上大模型版本繁杂、配套Agent工具更新频繁,很难快速厘清各家产品迭代脉络与生态布局。本文将按照国外大模型→国外汇总表格→国内大模型→国内汇总表格的结构,盘点全球主流商用大模型,完整梳理每家厂商背景、模型迭代历史、最新版本动态以及官方Agent工具生态,帮助读者一站式看懂当下主流大模型全貌。
一、国外大模型
1. Anthropic – Claude系列
厂商
- 所属公司:Anthropic
- 创建时间:2021年2月
- 创始人:Dario Amodei(达里奥·阿莫迪)和Daniela Amodei(丹妮拉·阿莫迪)兄妹,两人此前均在OpenAI任职,Dario曾任OpenAI研究副总裁,Daniela曾任OpenAI安全政策副总裁
- 厂商简介:由OpenAI离职核心团队创办,主打安全对齐、超长上下文、低成本企业级部署三大核心优势。区别于GPT的全能通用路线,Claude专注长文档处理、企业知识库对接、安全合规AI服务。亚马逊、谷歌为其投资方,深度入驻AWS云服务生态,是海外企业端最受欢迎的大模型之一。
模型
- Claude 1.0(2022):主打10万token超长上下文
- Claude 2.0(2023.07)
- Claude 3系列(Opus/Sonnet/Haiku,2024.03)
- Claude 3.5系列(2024.10)
- Claude 3.7 Sonnet(2025.02):全球首款混合推理模型
- Claude Sonnet 4.5(2025.09)
- Claude Sonnet 4.6(2026.02.17)
- Claude Opus 4.8(2026.05.29):编程、智能体、推理和知识工作能力显著提升
- Claude Fable 5 / Mythos 5(2026.06.09) :上下文上限突破200万token,新增Fable专项创意模型。在AA智能指数(65分)和LMArena文本生成榜(Elo 1510)均位列全球第一,在SWE-bench Pro上以80.3%的成绩领跑
Agent
- Claude Code:
- 2025年2月:推出预览版
- 2025年5月:正式向公众开放
- 2025年9月30日:发布Claude Sonnet 4.5版本,新增检查点功能、VS Code扩展,开放Claude Agent SDK
- 2026年1月12日:发布Claude Code v2.1.0,包含1096次代码提交
- 2026年3月31日:发布v2.1.88至npm
- 2026年4月15日:发布新版,上线Routine功能
- Claude Workspace:企业知识库Agent,支持企业文档批量解析、知识检索与自动化处理(2024.01上线)
2. OpenAI – GPT系列
厂商
- 所属公司:OpenAI
- 创建时间:2015年12月11日
- 创始人:Sam Altman(山姆·奥特曼)、Elon Musk(埃隆·马斯克)、Greg Brockman(格雷格·布罗克曼)等
- 厂商简介:OpenAI最初为非营利性AI研究实验室,2019年转型为有限盈利公司,微软为核心战略投资方。作为全球生成式大模型的开创者,GPT系列定义了通用大语言模型的行业标准,在通用对话、逻辑推理、长文本处理、代码生成领域长期处于第一梯队,也是全球商业化最成熟、生态最完善的大模型。
模型
- GPT-1(2018)
- GPT-2(2019)
- GPT-3(2020)
- GPT-3.5(2022.11.30):发布ChatGPT,开启全民AI对话时代
- GPT-4(2023.03.14)
- GPT-4 Turbo(2023.11)
- GPT-4.5(2025.02.27)
- GPT-5(2025.08)
- GPT-5.2(2025.08.11)
- GPT-5.3-Codex(2026.02.06)
- GPT-5.4(2026.03.06):具备原生计算机使用能力,支持100万token超长上下文
- GPT-5.5(2026.04) :上下文窗口扩容至105万token,长文本推理准确率大幅提升,支持原生视频理解与生成。AA智能指数61分,位列全球第二
Agent
- Codex:
- 2021年8月:以API形式发布测试版
- 2025年4月17日:推出开源本地工具Codex CLI
- 2025年5月16日:发布Codex研究预览版
- 2025年10月6日:Codex正式版发布
- 2025年12月中旬:GPT-5.2-Codex版本发布
- 2026年4月17日:发布重大更新,支持与用户协同操作电脑
- 2026年6月3日:发布智能体插件、定点修改等三项更新,周活用户达500万
- Deep Research V2.0(2026.02) :支持全自动全网信息检索、长报告自动撰写、多源数据交叉验证
3. Google DeepMind – Gemini系列
厂商
- 所属公司:Google DeepMind
- 创建时间:DeepMind成立于2010年,Gemini大模型项目2022年正式启动
- 核心负责人:Demis Hassabis
- 厂商简介:谷歌旗下顶级AI实验室,拥有全球顶尖多模态AI技术积累。Gemini是谷歌对标GPT打造的原生多模态大模型,从研发之初就同步支持文本、图片、音频、视频、代码全模态输入输出,依托谷歌搜索原生数据优势,实时信息检索能力为行业顶尖,同时免费开放基础版本,普惠性更强。
模型
- Gemini 1.0 Ultra/Pro/Nano(2023.12)
- Gemini 2.0系列(2024.12)
- Gemini 2.5(2025.03)
- Gemini 3(2025.11.18)
- Gemini 3.1系列(2026.02)
- Gemini 3.5 Flash(2026.05) :兼顾高性能与低延迟,移动端适配能力大幅提升,原生支持高清视频实时分析。AA智能指数55分,在Agent基准测试上表现超越Pro级模型
Agent
- Gemini CLI:Google命令行Agent工具,支持开发者通过终端直接调用Gemini模型完成代码生成、调试、测试等任务
- Antigravity 2.0(2026.05) :新一代智能体开发平台,可快速搭建端侧AI智能体,深度适配安卓全系设备
- Managed Agents API:使Agentic工作流的原型构建变得快速且低成本
- Gemini Spark:Google的24/7个人AI Agent雏形,能协助处理邮件、学习资料和日常工作
4. Meta – Llama系列
厂商
- 所属公司:Meta(元宇宙平台公司)
- 创建时间:2004年
- 创始人:Mark Zuckerberg(马克·扎克伯格)
- 厂商简介:Meta是开源大模型领域的绝对旗手,Llama系列长期占据开源模型性能榜首,是全球开发者社区最广泛使用的开源大模型之一。同时依托Facebook、WhatsApp、Instagram等海量应用生态,推动模型与社交场景深度融合。
模型
- LLaMA 1(2023.02)
- LLaMA 2(2023.07):参数扩展至70亿至700亿,开源商用
- Llama 3(2024.04.18)
- Llama 3.1(2024.07):参数规模达4050亿
- Llama 4(Scout、Maverick、Behemoth,2025.04):首次采用MoE架构
- Muse Spark(2026.03) :Meta闭源旗舰模型,在法国榜单中位列第六
Agent
- Meta AI助手:集成于Instagram、WhatsApp、Facebook等应用,支持对话、搜索、任务执行,具备基础Agent能力
- 开源社区提供第三方Agent框架适配,官方暂无独立命名的编程Agent工具
5. xAI – Grok系列
厂商
- 所属公司:xAI
- 创建时间:2023年3月注册,2023年7月12日正式宣布成立
- 创始人:Elon Musk(埃隆·马斯克)
- 厂商简介:xAI是马斯克对标OpenAI创办的AI公司,公司宗旨为“理解宇宙的本质”。Grok系列以实时联网、幽默风格、深度推理为特色,深度嵌入社交平台X(原Twitter),强调“真实世界知识”获取与实时信息整合能力。
模型
- Grok-1(2023.11 Beta)
- Grok 1.5(2024.01)
- Grok-1.5 Vision(2024.04):首个多模态版本
- Grok-2(2024)
- Grok-3(2025)
- Grok 4(2025.07)
- Grok 4.3 Beta(2026.04)
- Grok V9-Medium(2026.05完成训练)
Agent
- Grok App:嵌入X平台的对话Agent,支持联网搜索、信息整合、实时问答与任务执行
- 官方未推出独立编程Agent,主要以对话Agent形式提供服务
6. Mistral AI – Mistral系列
厂商
- 所属公司:Mistral AI(米斯特拉尔人工智能)
- 创建时间:2023年4月
- 创始人:Arthur Mensch(阿尔蒂尔·门施,前Google DeepMind研究员)、Guillaume Lample(纪尧姆·兰普尔,前Meta AI研究员)、Timothée Lacroix(蒂莫泰·拉克鲁瓦,前Meta AI研究员)
- 总部地点:法国巴黎
- 厂商简介:欧洲最具代表性的开源大模型厂商,以高性能、低成本、轻量化模型闻名全球,主打开发者友好和云端部署。Mistral在开源社区影响力仅次于Meta的Llama系列,是欧洲AI领域的重要力量。
模型
- 首个70亿参数开源模型(2023.09)
- Mistral Large(2024)
- Mistral Large 2.1(2024.11)
- Mistral Small 3.1(2025.03)
- Mistral Large 3(2025.12)
- Mistral Small 4(2026.03) :首款整合推理、多模态、编程能力的综合性LLM
Agent
- Le Chat:对话式AI助手(2025.02推出),支持工具调用和多步任务
- 提供API及开源Agent框架,但无官方独立命名的Agent工具
二、国外大模型总结
国外御三家指的是Claude,GPT,Gemini
| 厂商 | 模型 | Agent |
|---|---|---|
| Anthropic | Claude系列;最新:Claude Fable 5 / Mythos 5(2026.06) | Claude Code、Claude Workspace |
| OpenAI | GPT系列;最新:GPT-5.5(2026.04) | Codex、Deep Research V2.0 |
| Google DeepMind | Gemini系列;最新:Gemini 3.5 Flash(2026.05) | Gemini CLI、Antigravity 2.0、Gemini Spark |
| Meta | Llama系列;最新:Llama 4 / Muse Spark(2026.03) | Meta AI助手 |
| xAI | Grok系列;最新:Grok V9-Medium(2026.05) | Grok App |
| Mistral AI | Mistral系列;最新:Mistral Small 4(2026.03) | Le Chat |
三、国内大模型
1. DeepSeek(深度求索)
厂商
- 所属公司:幻方量化旗下AI公司
- 创建时间:2023年7月17日
- 创始人:梁文锋
- 厂商简介:以高性价比和深度开源策略著称的AI公司,DeepSeek系列模型在保持强劲性能的同时,以极具竞争力的定价和开源姿态迅速崛起。DeepSeek-V4-Flash连续四周位居OpenRouter周调用量榜首,旗下模型周调用总量达7.72万亿Token,连续五周位居第一。
模型
- DeepSeek LLM(2024.01.05)
- DeepSeek-V3(2024.12)
- DeepSeek-R1(2025.01.20)
- DeepSeek-V4预览版(2026.04.24) :具备百万级Token上下文处理能力,提供Pro与Flash两大版本。其中V4-Flash连续四周位居OpenRouter周调用量榜首
Agent
- DeepSeek Agentic Coding:DeepSeek-V4的Agent能力显著增强,在Agentic Coding评测中达到开源模型最佳水平。支持自主规划与工具调用,可自动拆解并执行多步流程
- 支持Function Calling、多步任务拆解、工具执行结果处理
2. 阿里巴巴 – 通义千问(Qwen)
厂商
- 所属公司:阿里巴巴达摩院
- 创建时间:1999年
- 创始人:马云等18人
- 大模型项目启动时间:2022年
- 通义千问正式发布时间:2023年4月
- 核心负责人:周明(达摩院语言实验室负责人)
- 厂商简介:阿里达摩院自研通用大模型,依托阿里云算力生态,主打开源开放、高性价比、代码生成、长上下文优势。通义千问全系模型开源程度国内领先,在大模型之家热力榜中位列第二。
模型
- 通义千问1.0(2023.04)
- Qwen 2系列(2024.06)
- Qwen2.5系列(2024.09)
- Qwen3-Max-Preview(2025.09)
- Qwen3.5(2026.02)
- Qwen3.5-Omni(2026.03)
- Qwen3.6-Plus(2026.04):3970亿总参数
- Qwen3.7-Plus(2026.06) :实现多模态混合智能体突破
- Qwen3.7-Max(2026.06) :新增视觉模态理解能力,支持多模态互动混合智能体
Agent
- Qwen Code:阿里官方编程Agent,深度集成至阿里云百炼平台
- 阿里云百炼:提供原生Function Calling支持、128K上下文与多工具并行调用能力
- 魔搭开发者平台 V4.2(2026.05) :新增一键模型微调、端侧模型打包功能。基于Qwen3.7构建的Hybrid-Agent系统可连续稳定运行超11小时
已在智谱AI的Agent工具部分新增 AutoClaw,以下是更新后的完整版本:
3. 智谱AI – GLM系列
厂商
- 所属公司:智谱AI(北京智谱华章科技股份有限公司)
- 创建时间:2019年6月11日
- 创始团队:刘德兵(董事长)、张鹏(CEO)等,脱胎于清华大学计算机系知识工程实验室(KEG)
- 厂商简介:国内头部大模型创业公司,GLM系列在国内率先对标GPT-4,以开源策略和强大的编程、推理能力著称。GLM-5.2在Code Arena上位列全球可用模型第二、开源模型第一。
模型
- GLM-4(2023)
- GLM-4.5(2025.07)
- GLM-5(2026.02)
- GLM-5.1(2026.04)
- GLM-5.2(2026.06.17) :主打1M无损上下文与长程代码任务,在Code Arena上位列全球可用模型第二、开源模型第一,采用MIT协议开源
Agent
- AutoClaw(澳龙) :智谱AI推出的AI Agent执行工具。定位为国内首个真·一键安装的本地版OpenClaw,将此前高门槛的AI智能体部署简化为“下载-安装-打开”三步操作。
- PC端(2026.03.10) :支持macOS与Windows双端一键部署,预置50+热门Skills,覆盖内容创作、办公、代码、营销、金融投研等高频场景;支持一键接入飞书等即时通讯工具;内置智谱专为Agent场景优化的专属模型Pony-Alpha-2,工具调用更稳、任务推进更强;集成自研AutoGLM Browser-Use能力,补齐多步骤、跨页面浏览器操作短板
- 自进化机制与Skill商店(2026.04.17) :AutoClaw上线自进化机制,每轮对话后自动扫描识别用户的纠正指令与偏好,经用户批准后写入长期记忆,实现“用得越多越懂你”;Skill商店同步上线,首批上架GLM Office Skills五件套(PPT、DOCX、XLSX、PDF、Charts)
- 移动端APP(2026.05) :在App Store上架移动端APP,支持本地“龙虾”与云“龙虾”双模式执行,支持创建群聊让多个Agent协作完成复杂任务
- ZCode 3.0(2026.06) :智谱AI编程Agent,切换到自研ZCode Agent内核,深度适配GLM-5.2。在Terminal-Bench 2.1上表现优异,相比GLM-5.1提升17.5%
- 智谱AI开放平台
其他部分(前言、国外大模型、国内其他厂商等)保持不变。
4. 月之暗面 – Kimi
厂商
- 所属公司:月之暗面(北京月之暗面科技有限公司)
- 创建时间:2023年4月17日
- 创始人:杨植麟(清华本科、卡内基梅隆博士)
- 厂商简介:以超长上下文处理能力著称的AI创业公司,月之暗面是国内大模型“六小龙”之一。Kimi系列在长文档处理、编程辅助等场景拥有广泛用户基础,在2026大模型创新TOP100中位列第六。
模型
- Kimi K2.5(2026.03)
- Kimi K2.7 Code(2026.06.12) :Kimi K2系列首款专注代码的专项模型
Agent
- Kimi Code:提供API开放平台和Kimi Code Plan服务
- Kimi K2.7 Code高速版(2026.06.16上线) :输出速度提升5-6倍
5. MiniMax
厂商
- 所属公司:MiniMax
- 创建时间:2022年1月
- 创始人:闫俊杰(前商汤科技副总裁)
- 厂商简介:国内AI创业公司,以自研MSA(MiniMax Sparse Attention)稀疏注意力架构见长,在长上下文和Agent能力上持续突破,是国内大模型“六小龙”之一。MiniMax M3在OpenRouter周调用量中位列第二,旗下模型周调用总量达4.68万亿Token。
模型
- MiniMax M2.7(2026.03)
- MiniMax M3(2026.06.01) :国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型,周调用量达4.32万亿Token,环比增长73%
Agent
- MiniMax通用Agent平台:基于M3全面开放,无需任何开发即可体验编码智能体
- MiniMax Code:面对复杂任务时自动拆解任务、规划步骤,由多个Agent协同推进,支持操作电脑桌面
6. 小米 – MiMo大模型
厂商
- 所属公司:小米
- 创建时间:2010年4月6日
- 创始人:雷军等8人
- 大模型项目启动时间:2024年
- 厂商简介:小米集团旗下大模型团队,依托小米海量终端设备和AIoT生态,走出“软硬融合”的差异化路线。MiMo-V2.5在OpenRouter周调用量中位居前列,在大模型之家热力榜中位列第八。
模型
- MiMo-V2.5-Pro(2026.04) :在全球权威大模型测评平台Artificial Analysis上获得综合智能指数与Agent指数全球开源模型并列第一。周调用量达2.19万亿Token,环比增长50%
- MiMo-V2.5-Pro-UltraSpeed模式(2026.06上线)
Agent
- MiMo Claw(2026.06.16正式版) :云端轻量化Agent产品,基于OpenClaw框架打造,搭载MiMo-V2.5-Pro旗舰模型。原生适配MCP工具调用协议,支持百万级超长上下文与千次以上连续工具调用。已与金山办公生态打通,覆盖Word、Excel、PPT、PDF等全链路文档办公提效方案。任务达标率(Pass³)达63.8%,Token消耗较同类产品降低40%-60%
- MiMo Code(2026.06.11开源) :探索性AI编程助手,基于OpenCode创新开发,支持持久记忆系统、无限上下文、模型Agent协同优化,采用MIT协议开源
7. 腾讯 – 混元大模型
厂商
- 所属公司:腾讯
- 创建时间:1998年11月11日
- 创始人:马化腾、张志东等
- 厂商简介:腾讯自研大模型,依托腾讯云和丰富的产品生态(微信、腾讯文档、CodeBuddy等),在办公协作和代码开发场景深度落地。混元Hy3 preview在OpenRouter周调用量中连续位居第三。
模型
- 混元Hy3 preview(2026.04.23发布并开源) :采用快慢思考融合的MoE架构,总参数295B,激活参数21B,最大支持256K上下文。周调用量达4.14万亿Token,环比增长41%
Agent
- CodeBuddy:腾讯官方编程Agent,已规模应用Hy3 preview
- WorkBuddy:腾讯办公Agent,覆盖文档处理、数据分析、知识检索等场景
- 腾讯AI Agent沙箱(2026.05) :开源,支持多Agent协同工作
- Hy3 preview已稳定驱动最长495步的复杂Agent工作流
8. 字节跳动 – 豆包大模型
厂商
- 所属公司:字节跳动(火山引擎)
- 创建时间:2012年3月9日
- 创始人:张一鸣
- 大模型项目启动时间:2023年2月
- 豆包公测时间:2023年8月17日
- 豆包正式发布:2024年5月15日
- 厂商简介:字节跳动旗下火山引擎推出的大模型家族,以多模态理解和Agent任务执行能力为核心特色。豆包在2026大模型创新TOP100中位列第一。
模型
- 云雀大模型(2023.08):豆包原名“云雀”
- 豆包大模型正式发布(2024.05.15)
- 豆包2.0(2026.02) :系列包含Pro、Lite、Mini三款通用Agent模型和Code模型。豆包2.0 Pro面向深度推理与长链路任务执行场景
Agent
- Trae:字节跳动官方编程Agent,深度集成豆包2.0能力
- 豆包“任务模式”(2026.06上线) :可自主完成从任务拆解、步骤规划、工具调用到结果交付的全链路执行
- Doubao-Seed-2.0-lite升级多Agent协同调度能力
9. 百度 – 文心大模型(ERNIE)
厂商
- 所属公司:百度
- 创建时间:2000年1月1日
- 创始人:李彦宏、徐勇
- 大模型项目启动时间:2019年
- 文心一言正式发布时间:2023年3月
- 核心负责人:王海峰(百度CTO)
- 厂商简介:国内最早布局大模型的互联网大厂,依托百度搜索海量中文语料、知识图谱生态,文心一言是国内首款面向公众开放的通用大模型。文心5.1在大模型之家热力榜中位列第一,LMArena搜索榜以1223分居国内第一、全球第四。
模型
- 文心一言1.0(2023.03)
- 文心一言3.0(2023.10)
- ERNIE 4.0(2024.04)
- 文心大模型4.5(2025.03.16)
- 文心大模型X1(2025.03.16)
- 文心大模型4.5 Turbo / X1 Turbo(2025.04.25)
- 文心大模型5.0 Preview(2025.11)
- ERNIE 5.0(2026.01.22) :国内首个参数量突破2.4万亿的超级模型
- 文心5.1(2026.05.09) :采用“多维弹性预训练”技术,总参数压缩至文心5.0的约1/3,预训练成本仅为业界同规模模型的6%
Agent
- 千帆智能体工作台 V3.0(2026.04) :企业级大模型服务平台,提供150+ SOTA模型服务,已累计开发超过130万个Agents
- 文心APP“多人多Agent群聊”(2026.01内测) :支持在同一群聊中调动多个AI角色
- DuMate(百度搭子) :百度通用智能体
- 秒哒3.0:代码智能体,90%代码由自身生成
10. 科大讯飞 – 星火大模型
厂商
- 所属公司:科大讯飞
- 创建时间:1999年12月30日
- 创始人:刘庆峰
- 大模型项目启动时间:2022年
- 星火大模型正式发布时间:2023年5月
- 厂商简介:国内认知智能龙头企业,星火大模型主打语音交互、数学推理、行业落地三大特色,依托讯飞深耕多年的语音技术,语音对话、语音转写能力远超国内外同类模型。深度布局教育、医疗、法律、政务垂直行业,全面适配国产昇腾算力生态。
模型
- 星火大模型1.0(2023.05)
- 星火V3.5(2024.08)
- 星火X1(2025.11)
- 星火X2(2026.02.11) :采用293B MoE稀疏架构,基于全国产算力训练,推理性能较X1.5提升约50%
Agent
- 星辰Agent平台:企业级智能体平台,智能体数量已超过130万
- 星火智能办公 V5.10(2026.05) :一站式集成文档解析、PPT生成、音视频处理、论文润色全办公能力
四、国内大模型总结
| 厂商 | 模型 | Agent |
|---|---|---|
| DeepSeek | DeepSeek系列;最新:DeepSeek-V4预览版(2026.04) | DeepSeek Agentic Coding |
| 阿里巴巴 | Qwen系列;最新:Qwen3.7-Plus/Max(2026.06) | Qwen Code、阿里云百炼、魔搭V4.2 |
| 智谱AI | GLM系列;最新:GLM-5.2(2026.06) | AutoClaw、ZCode 3.0、智谱AI开放平台 |
| 月之暗面 | Kimi系列;最新:Kimi K2.7 Code(2026.06) | Kimi Code、Kimi K2.7 Code高速版 |
| MiniMax | MiniMax系列;最新:MiniMax M3(2026.06) | MiniMax通用Agent平台、MiniMax Code |
| 小米 | MiMo系列;最新:MiMo-V2.5-Pro(2026.04) | MiMo Claw、MiMo Code |
| 腾讯 | 混元系列;最新:混元Hy3 preview(2026.04) | CodeBuddy、WorkBuddy、AI Agent沙箱 |
| 字节跳动 | 豆包系列;最新:豆包2.0(2026.02) | Trae、豆包“任务模式” |
| 百度 | 文心系列;最新:文心5.1(2026.05) | 千帆智能体工作台V3.0、DuMate、秒哒3.0 |
| 科大讯飞 | 星火系列;最新:星火X2(2026.02) | 星辰Agent平台、星火智能办公V5.10 |
说明:以上信息基于公开资料整理,模型版本及Agent工具发布时间截至2026年6月。大模型领域迭代迅速,建议关注各厂商官方渠道获取最新信息。
2280

被折叠的 条评论
为什么被折叠?



