【AI总结】2026年6月主流国内外大模型总结

最新推荐文章于 2026-06-18 15:47:26 发布

原创最新推荐文章于 2026-06-18 15:47:26 发布 · 710 阅读

8 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #深度学习

AI大模型专栏收录该内容

13 篇文章

订阅专栏

前言

自2022年ChatGPT引爆生成式AI浪潮以来，全球大模型行业进入高速迭代周期。海外科技巨头依托先发优势持续夯实通用大模型底座，国内大厂立足中文场景、国产化算力与行业落地需求，快速补齐技术短板，形成了国内外双线并行、差异化竞争的行业格局。

对于开发者、AI从业者以及普通用户而言，市面上大模型版本繁杂、配套Agent工具更新频繁，很难快速厘清各家产品迭代脉络与生态布局。本文将按照国外大模型→国外汇总表格→国内大模型→国内汇总表格的结构，盘点全球主流商用大模型，完整梳理每家厂商背景、模型迭代历史、最新版本动态以及官方Agent工具生态，帮助读者一站式看懂当下主流大模型全貌。

一、国外大模型

1. Anthropic – Claude系列

厂商

所属公司：Anthropic
创建时间：2021年2月
创始人：Dario Amodei（达里奥·阿莫迪）和Daniela Amodei（丹妮拉·阿莫迪）兄妹，两人此前均在OpenAI任职，Dario曾任OpenAI研究副总裁，Daniela曾任OpenAI安全政策副总裁
厂商简介：由OpenAI离职核心团队创办，主打安全对齐、超长上下文、低成本企业级部署三大核心优势。区别于GPT的全能通用路线，Claude专注长文档处理、企业知识库对接、安全合规AI服务。亚马逊、谷歌为其投资方，深度入驻AWS云服务生态，是海外企业端最受欢迎的大模型之一。

模型

Claude 1.0（2022）：主打10万token超长上下文
Claude 2.0（2023.07）
Claude 3系列（Opus/Sonnet/Haiku，2024.03）
Claude 3.5系列（2024.10）
Claude 3.7 Sonnet（2025.02）：全球首款混合推理模型
Claude Sonnet 4.5（2025.09）
Claude Sonnet 4.6（2026.02.17）
Claude Opus 4.8（2026.05.29）：编程、智能体、推理和知识工作能力显著提升
Claude Fable 5 / Mythos 5（2026.06.09） ：上下文上限突破200万token，新增Fable专项创意模型。在AA智能指数（65分）和LMArena文本生成榜（Elo 1510）均位列全球第一，在SWE-bench Pro上以80.3%的成绩领跑

Agent

Claude Code：
- 2025年2月：推出预览版
- 2025年5月：正式向公众开放
- 2025年9月30日：发布Claude Sonnet 4.5版本，新增检查点功能、VS Code扩展，开放Claude Agent SDK
- 2026年1月12日：发布Claude Code v2.1.0，包含1096次代码提交
- 2026年3月31日：发布v2.1.88至npm
- 2026年4月15日：发布新版，上线Routine功能
Claude Workspace：企业知识库Agent，支持企业文档批量解析、知识检索与自动化处理（2024.01上线）

2. OpenAI – GPT系列

厂商

所属公司：OpenAI
创建时间：2015年12月11日
创始人：Sam Altman（山姆·奥特曼）、Elon Musk（埃隆·马斯克）、Greg Brockman（格雷格·布罗克曼）等
厂商简介：OpenAI最初为非营利性AI研究实验室，2019年转型为有限盈利公司，微软为核心战略投资方。作为全球生成式大模型的开创者，GPT系列定义了通用大语言模型的行业标准，在通用对话、逻辑推理、长文本处理、代码生成领域长期处于第一梯队，也是全球商业化最成熟、生态最完善的大模型。

模型

GPT-1（2018）
GPT-2（2019）
GPT-3（2020）
GPT-3.5（2022.11.30）：发布ChatGPT，开启全民AI对话时代
GPT-4（2023.03.14）
GPT-4 Turbo（2023.11）
GPT-4.5（2025.02.27）
GPT-5（2025.08）
GPT-5.2（2025.08.11）
GPT-5.3-Codex（2026.02.06）
GPT-5.4（2026.03.06）：具备原生计算机使用能力，支持100万token超长上下文
GPT-5.5（2026.04） ：上下文窗口扩容至105万token，长文本推理准确率大幅提升，支持原生视频理解与生成。AA智能指数61分，位列全球第二

Agent

Codex：
- 2021年8月：以API形式发布测试版
- 2025年4月17日：推出开源本地工具Codex CLI
- 2025年5月16日：发布Codex研究预览版
- 2025年10月6日：Codex正式版发布
- 2025年12月中旬：GPT-5.2-Codex版本发布
- 2026年4月17日：发布重大更新，支持与用户协同操作电脑
- 2026年6月3日：发布智能体插件、定点修改等三项更新，周活用户达500万
Deep Research V2.0（2026.02） ：支持全自动全网信息检索、长报告自动撰写、多源数据交叉验证

3. Google DeepMind – Gemini系列

厂商

所属公司：Google DeepMind
创建时间：DeepMind成立于2010年，Gemini大模型项目2022年正式启动
核心负责人：Demis Hassabis
厂商简介：谷歌旗下顶级AI实验室，拥有全球顶尖多模态AI技术积累。Gemini是谷歌对标GPT打造的原生多模态大模型，从研发之初就同步支持文本、图片、音频、视频、代码全模态输入输出，依托谷歌搜索原生数据优势，实时信息检索能力为行业顶尖，同时免费开放基础版本，普惠性更强。

模型

Gemini 1.0 Ultra/Pro/Nano（2023.12）
Gemini 2.0系列（2024.12）
Gemini 2.5（2025.03）
Gemini 3（2025.11.18）
Gemini 3.1系列（2026.02）
Gemini 3.5 Flash（2026.05） ：兼顾高性能与低延迟，移动端适配能力大幅提升，原生支持高清视频实时分析。AA智能指数55分，在Agent基准测试上表现超越Pro级模型

Agent

Gemini CLI：Google命令行Agent工具，支持开发者通过终端直接调用Gemini模型完成代码生成、调试、测试等任务
Antigravity 2.0（2026.05） ：新一代智能体开发平台，可快速搭建端侧AI智能体，深度适配安卓全系设备
Managed Agents API：使Agentic工作流的原型构建变得快速且低成本
Gemini Spark：Google的24/7个人AI Agent雏形，能协助处理邮件、学习资料和日常工作

4. Meta – Llama系列

厂商

所属公司：Meta（元宇宙平台公司）
创建时间：2004年
创始人：Mark Zuckerberg（马克·扎克伯格）
厂商简介：Meta是开源大模型领域的绝对旗手，Llama系列长期占据开源模型性能榜首，是全球开发者社区最广泛使用的开源大模型之一。同时依托Facebook、WhatsApp、Instagram等海量应用生态，推动模型与社交场景深度融合。

模型

LLaMA 1（2023.02）
LLaMA 2（2023.07）：参数扩展至70亿至700亿，开源商用
Llama 3（2024.04.18）
Llama 3.1（2024.07）：参数规模达4050亿
Llama 4（Scout、Maverick、Behemoth，2025.04）：首次采用MoE架构
Muse Spark（2026.03） ：Meta闭源旗舰模型，在法国榜单中位列第六

Agent

Meta AI助手：集成于Instagram、WhatsApp、Facebook等应用，支持对话、搜索、任务执行，具备基础Agent能力
开源社区提供第三方Agent框架适配，官方暂无独立命名的编程Agent工具

5. xAI – Grok系列

厂商

所属公司：xAI
创建时间：2023年3月注册，2023年7月12日正式宣布成立
创始人：Elon Musk（埃隆·马斯克）
厂商简介：xAI是马斯克对标OpenAI创办的AI公司，公司宗旨为“理解宇宙的本质”。Grok系列以实时联网、幽默风格、深度推理为特色，深度嵌入社交平台X（原Twitter），强调“真实世界知识”获取与实时信息整合能力。

模型

Grok-1（2023.11 Beta）
Grok 1.5（2024.01）
Grok-1.5 Vision（2024.04）：首个多模态版本
Grok-2（2024）
Grok-3（2025）
Grok 4（2025.07）
Grok 4.3 Beta（2026.04）
Grok V9-Medium（2026.05完成训练）

Agent

Grok App：嵌入X平台的对话Agent，支持联网搜索、信息整合、实时问答与任务执行
官方未推出独立编程Agent，主要以对话Agent形式提供服务

6. Mistral AI – Mistral系列

厂商

所属公司：Mistral AI（米斯特拉尔人工智能）
创建时间：2023年4月
创始人：Arthur Mensch（阿尔蒂尔·门施，前Google DeepMind研究员）、Guillaume Lample（纪尧姆·兰普尔，前Meta AI研究员）、Timothée Lacroix（蒂莫泰·拉克鲁瓦，前Meta AI研究员）
总部地点：法国巴黎
厂商简介：欧洲最具代表性的开源大模型厂商，以高性能、低成本、轻量化模型闻名全球，主打开发者友好和云端部署。Mistral在开源社区影响力仅次于Meta的Llama系列，是欧洲AI领域的重要力量。

模型

首个70亿参数开源模型（2023.09）
Mistral Large（2024）
Mistral Large 2.1（2024.11）
Mistral Small 3.1（2025.03）
Mistral Large 3（2025.12）
Mistral Small 4（2026.03） ：首款整合推理、多模态、编程能力的综合性LLM

Agent

Le Chat：对话式AI助手（2025.02推出），支持工具调用和多步任务
提供API及开源Agent框架，但无官方独立命名的Agent工具

二、国外大模型总结

国外御三家指的是Claude，GPT，Gemini

厂商	模型	Agent
Anthropic	Claude系列；最新：Claude Fable 5 / Mythos 5（2026.06）	Claude Code、Claude Workspace
OpenAI	GPT系列；最新：GPT-5.5（2026.04）	Codex、Deep Research V2.0
Google DeepMind	Gemini系列；最新：Gemini 3.5 Flash（2026.05）	Gemini CLI、Antigravity 2.0、Gemini Spark
Meta	Llama系列；最新：Llama 4 / Muse Spark（2026.03）	Meta AI助手
xAI	Grok系列；最新：Grok V9-Medium（2026.05）	Grok App
Mistral AI	Mistral系列；最新：Mistral Small 4（2026.03）	Le Chat

三、国内大模型

1. DeepSeek（深度求索）

厂商

所属公司：幻方量化旗下AI公司
创建时间：2023年7月17日
创始人：梁文锋
厂商简介：以高性价比和深度开源策略著称的AI公司，DeepSeek系列模型在保持强劲性能的同时，以极具竞争力的定价和开源姿态迅速崛起。DeepSeek-V4-Flash连续四周位居OpenRouter周调用量榜首，旗下模型周调用总量达7.72万亿Token，连续五周位居第一。

模型

DeepSeek LLM（2024.01.05）
DeepSeek-V3（2024.12）
DeepSeek-R1（2025.01.20）
DeepSeek-V4预览版（2026.04.24） ：具备百万级Token上下文处理能力，提供Pro与Flash两大版本。其中V4-Flash连续四周位居OpenRouter周调用量榜首

Agent

DeepSeek Agentic Coding：DeepSeek-V4的Agent能力显著增强，在Agentic Coding评测中达到开源模型最佳水平。支持自主规划与工具调用，可自动拆解并执行多步流程
支持Function Calling、多步任务拆解、工具执行结果处理

2. 阿里巴巴 – 通义千问（Qwen）

厂商

所属公司：阿里巴巴达摩院
创建时间：1999年
创始人：马云等18人
大模型项目启动时间：2022年
通义千问正式发布时间：2023年4月
核心负责人：周明（达摩院语言实验室负责人）
厂商简介：阿里达摩院自研通用大模型，依托阿里云算力生态，主打开源开放、高性价比、代码生成、长上下文优势。通义千问全系模型开源程度国内领先，在大模型之家热力榜中位列第二。

模型

通义千问1.0（2023.04）
Qwen 2系列（2024.06）
Qwen2.5系列（2024.09）
Qwen3-Max-Preview（2025.09）
Qwen3.5（2026.02）
Qwen3.5-Omni（2026.03）
Qwen3.6-Plus（2026.04）：3970亿总参数
Qwen3.7-Plus（2026.06） ：实现多模态混合智能体突破
Qwen3.7-Max（2026.06） ：新增视觉模态理解能力，支持多模态互动混合智能体

Agent

Qwen Code：阿里官方编程Agent，深度集成至阿里云百炼平台
阿里云百炼：提供原生Function Calling支持、128K上下文与多工具并行调用能力
魔搭开发者平台 V4.2（2026.05） ：新增一键模型微调、端侧模型打包功能。基于Qwen3.7构建的Hybrid-Agent系统可连续稳定运行超11小时

已在智谱AI的Agent工具部分新增 AutoClaw，以下是更新后的完整版本：

3. 智谱AI – GLM系列

厂商

所属公司：智谱AI（北京智谱华章科技股份有限公司）
创建时间：2019年6月11日
创始团队：刘德兵（董事长）、张鹏（CEO）等，脱胎于清华大学计算机系知识工程实验室（KEG）
厂商简介：国内头部大模型创业公司，GLM系列在国内率先对标GPT-4，以开源策略和强大的编程、推理能力著称。GLM-5.2在Code Arena上位列全球可用模型第二、开源模型第一。

模型

GLM-4（2023）
GLM-4.5（2025.07）
GLM-5（2026.02）
GLM-5.1（2026.04）
GLM-5.2（2026.06.17） ：主打1M无损上下文与长程代码任务，在Code Arena上位列全球可用模型第二、开源模型第一，采用MIT协议开源

Agent

AutoClaw（澳龙） ：智谱AI推出的AI Agent执行工具。定位为国内首个真·一键安装的本地版OpenClaw，将此前高门槛的AI智能体部署简化为“下载-安装-打开”三步操作。
- PC端（2026.03.10） ：支持macOS与Windows双端一键部署，预置50+热门Skills，覆盖内容创作、办公、代码、营销、金融投研等高频场景；支持一键接入飞书等即时通讯工具；内置智谱专为Agent场景优化的专属模型Pony-Alpha-2，工具调用更稳、任务推进更强；集成自研AutoGLM Browser-Use能力，补齐多步骤、跨页面浏览器操作短板
- 自进化机制与Skill商店（2026.04.17） ：AutoClaw上线自进化机制，每轮对话后自动扫描识别用户的纠正指令与偏好，经用户批准后写入长期记忆，实现“用得越多越懂你”；Skill商店同步上线，首批上架GLM Office Skills五件套（PPT、DOCX、XLSX、PDF、Charts）
- 移动端APP（2026.05） ：在App Store上架移动端APP，支持本地“龙虾”与云“龙虾”双模式执行，支持创建群聊让多个Agent协作完成复杂任务
ZCode 3.0（2026.06） ：智谱AI编程Agent，切换到自研ZCode Agent内核，深度适配GLM-5.2。在Terminal-Bench 2.1上表现优异，相比GLM-5.1提升17.5%
智谱AI开放平台

其他部分（前言、国外大模型、国内其他厂商等）保持不变。

4. 月之暗面 – Kimi

厂商

所属公司：月之暗面（北京月之暗面科技有限公司）
创建时间：2023年4月17日
创始人：杨植麟（清华本科、卡内基梅隆博士）
厂商简介：以超长上下文处理能力著称的AI创业公司，月之暗面是国内大模型“六小龙”之一。Kimi系列在长文档处理、编程辅助等场景拥有广泛用户基础，在2026大模型创新TOP100中位列第六。

模型

Kimi K2.5（2026.03）
Kimi K2.7 Code（2026.06.12） ：Kimi K2系列首款专注代码的专项模型

Agent

Kimi Code：提供API开放平台和Kimi Code Plan服务
Kimi K2.7 Code高速版（2026.06.16上线） ：输出速度提升5-6倍

5. MiniMax

厂商

所属公司：MiniMax
创建时间：2022年1月
创始人：闫俊杰（前商汤科技副总裁）
厂商简介：国内AI创业公司，以自研MSA（MiniMax Sparse Attention）稀疏注意力架构见长，在长上下文和Agent能力上持续突破，是国内大模型“六小龙”之一。MiniMax M3在OpenRouter周调用量中位列第二，旗下模型周调用总量达4.68万亿Token。

模型

MiniMax M2.7（2026.03）
MiniMax M3（2026.06.01） ：国内首个同时具备“前沿Coding能力、1M超长上下文、原生多模态”三项核心能力的大模型，周调用量达4.32万亿Token，环比增长73%

Agent

MiniMax通用Agent平台：基于M3全面开放，无需任何开发即可体验编码智能体
MiniMax Code：面对复杂任务时自动拆解任务、规划步骤，由多个Agent协同推进，支持操作电脑桌面

6. 小米 – MiMo大模型

厂商

所属公司：小米
创建时间：2010年4月6日
创始人：雷军等8人
大模型项目启动时间：2024年
厂商简介：小米集团旗下大模型团队，依托小米海量终端设备和AIoT生态，走出“软硬融合”的差异化路线。MiMo-V2.5在OpenRouter周调用量中位居前列，在大模型之家热力榜中位列第八。

模型

MiMo-V2.5-Pro（2026.04） ：在全球权威大模型测评平台Artificial Analysis上获得综合智能指数与Agent指数全球开源模型并列第一。周调用量达2.19万亿Token，环比增长50%
MiMo-V2.5-Pro-UltraSpeed模式（2026.06上线）

Agent

MiMo Claw（2026.06.16正式版） ：云端轻量化Agent产品，基于OpenClaw框架打造，搭载MiMo-V2.5-Pro旗舰模型。原生适配MCP工具调用协议，支持百万级超长上下文与千次以上连续工具调用。已与金山办公生态打通，覆盖Word、Excel、PPT、PDF等全链路文档办公提效方案。任务达标率（Pass³）达63.8%，Token消耗较同类产品降低40%-60%
MiMo Code（2026.06.11开源） ：探索性AI编程助手，基于OpenCode创新开发，支持持久记忆系统、无限上下文、模型Agent协同优化，采用MIT协议开源

7. 腾讯 – 混元大模型

厂商

所属公司：腾讯
创建时间：1998年11月11日
创始人：马化腾、张志东等
厂商简介：腾讯自研大模型，依托腾讯云和丰富的产品生态（微信、腾讯文档、CodeBuddy等），在办公协作和代码开发场景深度落地。混元Hy3 preview在OpenRouter周调用量中连续位居第三。

模型

混元Hy3 preview（2026.04.23发布并开源） ：采用快慢思考融合的MoE架构，总参数295B，激活参数21B，最大支持256K上下文。周调用量达4.14万亿Token，环比增长41%

Agent

CodeBuddy：腾讯官方编程Agent，已规模应用Hy3 preview
WorkBuddy：腾讯办公Agent，覆盖文档处理、数据分析、知识检索等场景
腾讯AI Agent沙箱（2026.05） ：开源，支持多Agent协同工作
Hy3 preview已稳定驱动最长495步的复杂Agent工作流

8. 字节跳动 – 豆包大模型

厂商

所属公司：字节跳动（火山引擎）
创建时间：2012年3月9日
创始人：张一鸣
大模型项目启动时间：2023年2月
豆包公测时间：2023年8月17日
豆包正式发布：2024年5月15日
厂商简介：字节跳动旗下火山引擎推出的大模型家族，以多模态理解和Agent任务执行能力为核心特色。豆包在2026大模型创新TOP100中位列第一。

模型

云雀大模型（2023.08）：豆包原名“云雀”
豆包大模型正式发布（2024.05.15）
豆包2.0（2026.02） ：系列包含Pro、Lite、Mini三款通用Agent模型和Code模型。豆包2.0 Pro面向深度推理与长链路任务执行场景

Agent

Trae：字节跳动官方编程Agent，深度集成豆包2.0能力
豆包“任务模式”（2026.06上线） ：可自主完成从任务拆解、步骤规划、工具调用到结果交付的全链路执行
Doubao-Seed-2.0-lite升级多Agent协同调度能力

9. 百度 – 文心大模型（ERNIE）

厂商

所属公司：百度
创建时间：2000年1月1日
创始人：李彦宏、徐勇
大模型项目启动时间：2019年
文心一言正式发布时间：2023年3月
核心负责人：王海峰（百度CTO）
厂商简介：国内最早布局大模型的互联网大厂，依托百度搜索海量中文语料、知识图谱生态，文心一言是国内首款面向公众开放的通用大模型。文心5.1在大模型之家热力榜中位列第一，LMArena搜索榜以1223分居国内第一、全球第四。

模型

文心一言1.0（2023.03）
文心一言3.0（2023.10）
ERNIE 4.0（2024.04）
文心大模型4.5（2025.03.16）
文心大模型X1（2025.03.16）
文心大模型4.5 Turbo / X1 Turbo（2025.04.25）
文心大模型5.0 Preview（2025.11）
ERNIE 5.0（2026.01.22） ：国内首个参数量突破2.4万亿的超级模型
文心5.1（2026.05.09） ：采用“多维弹性预训练”技术，总参数压缩至文心5.0的约1/3，预训练成本仅为业界同规模模型的6%

Agent

千帆智能体工作台 V3.0（2026.04） ：企业级大模型服务平台，提供150+ SOTA模型服务，已累计开发超过130万个Agents
文心APP“多人多Agent群聊”（2026.01内测） ：支持在同一群聊中调动多个AI角色
DuMate（百度搭子） ：百度通用智能体
秒哒3.0：代码智能体，90%代码由自身生成

10. 科大讯飞 – 星火大模型

厂商

所属公司：科大讯飞
创建时间：1999年12月30日
创始人：刘庆峰
大模型项目启动时间：2022年
星火大模型正式发布时间：2023年5月
厂商简介：国内认知智能龙头企业，星火大模型主打语音交互、数学推理、行业落地三大特色，依托讯飞深耕多年的语音技术，语音对话、语音转写能力远超国内外同类模型。深度布局教育、医疗、法律、政务垂直行业，全面适配国产昇腾算力生态。

模型

星火大模型1.0（2023.05）
星火V3.5（2024.08）
星火X1（2025.11）
星火X2（2026.02.11） ：采用293B MoE稀疏架构，基于全国产算力训练，推理性能较X1.5提升约50%

Agent

星辰Agent平台：企业级智能体平台，智能体数量已超过130万
星火智能办公 V5.10（2026.05） ：一站式集成文档解析、PPT生成、音视频处理、论文润色全办公能力

四、国内大模型总结

厂商	模型	Agent
DeepSeek	DeepSeek系列；最新：DeepSeek-V4预览版（2026.04）	DeepSeek Agentic Coding
阿里巴巴	Qwen系列；最新：Qwen3.7-Plus/Max（2026.06）	Qwen Code、阿里云百炼、魔搭V4.2
智谱AI	GLM系列；最新：GLM-5.2（2026.06）	AutoClaw、ZCode 3.0、智谱AI开放平台
月之暗面	Kimi系列；最新：Kimi K2.7 Code（2026.06）	Kimi Code、Kimi K2.7 Code高速版
MiniMax	MiniMax系列；最新：MiniMax M3（2026.06）	MiniMax通用Agent平台、MiniMax Code
小米	MiMo系列；最新：MiMo-V2.5-Pro（2026.04）	MiMo Claw、MiMo Code
腾讯	混元系列；最新：混元Hy3 preview（2026.04）	CodeBuddy、WorkBuddy、AI Agent沙箱
字节跳动	豆包系列；最新：豆包2.0（2026.02）	Trae、豆包“任务模式”
百度	文心系列；最新：文心5.1（2026.05）	千帆智能体工作台V3.0、DuMate、秒哒3.0
科大讯飞	星火系列；最新：星火X2（2026.02）	星辰Agent平台、星火智能办公V5.10