免费多模态大模型来了：Agnes 三大模型实测与 Claude Code 接入指南

最新推荐文章于 2026-07-03 17:05:11 发布

原创最新推荐文章于 2026-07-03 17:05:11 发布 · 346 阅读

3 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

收录于

AI 时代程序员必备技能

Codex、Claude Code、Cursor、Hermes Agent、OpenClaw等工程化实战专栏，讲透 AI 如何接管脏活累活

一键订阅

一、产品概述

Agnes 是新加坡 Sapiens AI 公司推出的多模态大模型产品线，覆盖文本、图像、视频三大模态。Sapiens AI 是新加坡本土模型公司，也是 Agnes AI 的母公司。其模型家族包含在 PinchBench 上榜的高精度模型，专为 OpenClaw、Hermes 等智能体工具设计。

1.1 三大产品线

Agnes AI 目前运营三条产品线：

产品	定位	入口	核心功能
Agnes	聊天机器人 / API 服务	app.agnes-ai.com	对话、搜索、创作、生产力
Echo	移动端 AI 助手	echo-ai.life	多模态对话、故事创作
Pavo	创意工具	app.pavo-ai.work	短片、智能体模式、视频生成、图像生成

1.2 模型矩阵

模型	版本	模态	API 端点	上下文窗口	状态
Agnes-1.5-Flash	v1.5	文本	`/v1/chat/completions`	256K / 64K 输出	已上线
Agnes-2.0-Flash	v2.0	文本	`/v1/chat/completions`	256K / 64K 输出	已验证
Agnes-Image-2.0-Flash	v2.0	图像	`/v1/images/generations`	—	已上线
Agnes-Image-2.1-Flash	v2.1	图像	`/v1/images/generations`	—	已验证
Agnes-Video-V2.0	v2.0	视频	`/v1/videos`	—	已上线
Agnes-Image-2.5-Preview	—	图像	待公布	—	即将发布
Agnes-Video-2.5-Preview	—	视频	待公布	—	即将发布

注：Agnes-2.0-Flash 曾于 2026 年 6 月前提供 1M 上下文窗口，后因稳定性回滚至 256K。

1.3 API 基础设施

公网 API Hub：https://apihub.agnes-ai.com/v1
认证方式：AGNES_API_KEY（Bearer Token，OpenAI 兼容格式）
协议兼容：OpenAI API 兼容（Chat Completions / Images Generations / Videos）
API 平台：https://platform.agnes-ai.com（订阅管理 / Key 管理）

二、Claude Code 多模型接入方案

核心问题：如何在 Claude Code 中同时使用 Agnes 的三个模型，而不是反复切换配置？

目前接入 Agnes 有三条路径，分别作用于 Claude Code 的不同层面：

方式	作用层面	文本	图像	视频	保留 Claude
cc-switch	主模型端点切换	✅	❌	❌	❌（替换主模型）
MCP Server	工具扩展	✅	✅	✅	✅
LiteLLM 代理	主模型端点替换	✅	❌	❌	❌（替换主模型）

2.1 cc-switch：主模型切换工具（仅文本）

cc-switch 是一个开源的桌面端配置管理工具（GitHub: farion1231/cc-switch），用于在多套 Claude Code / Codex API 供应商配置之间一键切换。你目前正是用它把 Claude Code 的主模型切到 Agnes-2.0-Flash。

工作原理：每套"供应商配置"是一组凭证——ANTHROPIC_BASE_URL + ANTHROPIC_API_KEY（或 ANTHROPIC_AUTH_TOKEN）+ 可选 ANTHROPIC_MODEL。切换时，cc-switch 把选中的配置写入 Claude Code 的 ~/.claude/settings.json（env 块）或 ~/.claude.json，下次启动 Claude Code 即指向新的端点。

cc-switch GUI
   ├─ 配置 A：官方 Anthropic   (base_url=api.anthropic.com,  model=claude-...)
   ├─ 配置 B：Agnes 文本       (base_url=<agnes端点>,        model=agnes-2.0-flash)  ← 当前启用
   └─ 配置 C：GLM / DeepSeek  (...)
        │
        ▼  一键切换 → 写入 settings.json 的 env
   Claude Code 启动 → 主对话模型 = Agnes-2.0-Flash

能做什么：一键切换主对话模型，无需手动改环境变量；可管理多套供应商配置。

不能做什么：

❌ 只能切换文本主模型。cc-switch 的配置只有"一个聊天端点"，没有图像/视频模型的位置。
❌ 无法配置图像或视频模型。Claude Code 主循环只走文本对话（Messages API），没有"图像生成端点""视频生成端点"可供重定向。
❌ 替换了 Claude 主模型，失去 Claude 原生能力。

⚠️ 协议适配说明：Claude Code 走 Anthropic Messages 协议（/v1/messages）。Agnes 官方 API 为 OpenAI 兼容格式（/v1/chat/completions）。要通过 cc-switch 把主模型切到 Agnes，目标端点需提供 Anthropic 兼容接口——通常依赖中转服务或转换代理（如 claude-code-router / LiteLLM）。你当前能正常使用 Agnes-2.0-Flash，说明这一适配已具备。

2.2 MCP Server：工具扩展（文本/图像/视频）

MCP（Model Context Protocol）是 Claude Code 的标准工具扩展协议。通过开发一个 Agnes MCP Server，可以把三个模型统一暴露为工具——这是接入图像和视频模型的唯一方式。

工具定义：

工具名	功能	对应模型
`agnes_chat`	文本对话/推理	Agnes-2.0-Flash
`agnes_generate_image`	文生图/图生图	Agnes-Image-2.1-Flash
`agnes_generate_video`	视频生成（异步）	Agnes-Video-V2.0

在这里插入图片描述

工作流程：

用户 → Claude Code → 分析任务 → 选择工具
    → agnes_chat / agnes_generate_image / agnes_generate_video
    → MCP Server 转发 → apihub.agnes-ai.com
    → 返回结果 → Claude 整合展示

优势：统一入口、Claude 自主决策、三个模型一次配置全部可用、保留 Claude 原生能力

局限：需自行开发/部署 MCP Server；文本模型作为工具调用，不替代主模型

现成方案（2026-07 更新）：经检索，Agnes 生态已有可直接使用的 skill 和 MCP server，不必从零开发：

类型	仓库	星标	覆盖模态
Agent Skill	`Yacey/agnes-ai-generation-skill`	290	文本/图像/视频
官方网关+目录	`AgnesAI-Labs/AgnesAI-Models`	275	官方维护
Agent Skill	`kangarooking/agnes-free-model-skills`	137	免费层模型
Claude Code Skill	`ziho7/agnes-skills`	39	图像/视频
MCP Server	`KingingWang/agnes-mcp`	4	文本/图像/视频（Rust）

推荐 Yacey/agnes-ai-generation-skill：三模态全覆盖、人气最高、活跃维护，与本文三工具设计一致。安装前需确认其 SKILL.md 路径并链入 ~/.claude/skills/。此外本地已装的 baoyu-image-gen skill 也支持 Agnes 图像 provider（--provider agnes），可作图像生成的即时替代。

2.3 cc-switch 与 MCP 的区别

两者作用于 Claude Code 的不同层面，并非二选一：

对比维度	cc-switch	MCP Server
本质	切换主模型端点（替换底层 LLM）	给 Claude 添加工具（保留 Claude）
作用层面	主对话模型	工具调用层
文本模型	✅ 直接替换为 Agnes-2.0-Flash	✅ 作为工具调用
图像模型	❌ 不支持	✅ 作为工具调用
视频模型	❌ 不支持	✅ 作为工具调用
Claude 原生能力	❌ 被替换	✅ 保留
同时多模型	❌ 一次一个主模型	✅ 多工具并存
配置方式	GUI 一键切换 + 写 settings.json	`.mcp.json` 声明工具
运行时依赖	无（仅改配置文件）	需运行 MCP Server 进程

一句话区分：

cc-switch 回答的是"用什么模型跟我对话"（主模型层）
MCP Server 回答的是"Claude 能调用哪些额外能力"（工具层）

2.4 能否同时配置图像和视频模型？

结论：cc-switch 不能配置图像和视频模型，只能配置文本主模型。

这正是你目前"只配了文本模型"的根本原因——不是配置步骤没做对，而是 cc-switch 这条路径本身就没有图像/视频的位置。它的配置只有"一个聊天端点 + 一个模型名"，没有图像/视频模型字段；Claude Code 主循环也没有图像/视频端点可供重定向。

要补齐图像和视频，必须走 MCP Server（agnes_generate_image + agnes_generate_video 工具）。

两者可以共存，互不冲突：

模态	接入方式	说明
文本	cc-switch（已配好）	继续用 Agnes-2.0-Flash 作主模型
图像	MCP Server（agnes_generate_image）	新增工具
视频	MCP Server（agnes_generate_video）	新增工具

cc-switch 管主模型（文本），MCP Server 管图像/视频工具，两套机制并行工作。若你希望文本也走 MCP（保留 Claude 原生能力、统一入口），可把 agnes_chat 一并加入 MCP Server，文本主模型切回 Claude。

2.5 LiteLLM 代理（文本模型技术细节）

LiteLLM 是 cc-switch 之外另一种"替换主模型"的方式，原理相近但需自建代理进程。它把 OpenAI 格式请求转为 Anthropic 格式，通过修改 ANTHROPIC_BASE_URL 指向本地 LiteLLM 代理，让 Claude Code 底层使用 Agnes-2.0-Flash：

# 1. 安装 LiteLLM
pip install litellm[proxy]

# 2. 配置 litellm_config.yaml
model_list:
  - model_name: agnes-2.0-flash
    litellm_params:
      model: openai/agnes-2.0-flash
      api_base: https://apihub.agnes-ai.com/v1
      api_key: os.environ/AGNES_API_KEY
      max_tokens: 65536  # Agnes-2.0-Flash 64K 输出上限

# 3. 启动代理
litellm --config litellm_config.yaml --port 4000

# 4. 配置 Claude Code 使用 Agnes
export ANTHROPIC_BASE_URL=http://localhost:4000
export ANTHROPIC_API_KEY=sk-agnostic  # LiteLLM 虚拟 key

在这里插入图片描述

与 cc-switch 的关系：两者都"替换主模型、仅文本"。区别是 cc-switch 直接切端点（依赖目标端点已兼容 Anthropic 协议或经中转），LiteLLM 则自建转换代理。若 cc-switch 已能正常使用 Agnes 文本模型，无需再上 LiteLLM。

2.6 推荐方案：cc-switch + MCP Server 组合

针对你的现状（cc-switch 已配好文本），最优策略是组合使用：

模态	接入方式	理由
文本	cc-switch（保留现状）或 MCP `agnes_chat`	已可用；若想保留 Claude 原生能力则改走 MCP
图像	MCP Server（agnes_generate_image 工具）	唯一可行路径
视频	MCP Server（agnes_generate_video 工具）	唯一可行路径，封装异步轮询

行动建议：开发并配置 Agnes MCP Server，把图像、视频（可选文本）作为工具接入；cc-switch 维持文本主模型不变。三个模型全部可用，改动最小。

2.7 环境变量速查

变量	用途	示例
`AGNES_API_KEY`	Agnes API 认证	`sk-agnes-xxx`
`AGNES_IMAGE_MODEL`	覆盖默认图像模型	`agnes-image-2.0-flash`
`AGNES_BASE_URL`	覆盖 API 端点	`https://apihub.agnes-ai.com/v1`
`ANTHROPIC_BASE_URL`	cc-switch / LiteLLM 切换主模型端点	`https://<agnes兼容端点>`
`ANTHROPIC_MODEL`	指定主模型名称	`agnes-2.0-flash`

三、架构分析

3.1 推理基础设施

基于 API Hub 的公开信息：

推理服务部署在云端，通过 API Hub 统一暴露公网接口
限流策略按用户等级区分：Free 20RPM / Enterprise 40RPM / Token Plan 1000RPM
架构推测：API Hub（公网）→ 负载均衡 → GPU 推理集群

3.2 API 兼容性设计

Agnes 选择 OpenAI 兼容协议，降低了接入成本：

所有支持 OpenAI API 的客户端/SDK 可直接使用
LiteLLM、LangChain 等工具链零修改接入
Chat Completions + Images Generations + Videos 覆盖三大场景
视频生成采用异步任务模型，POST 创建 → GET 轮询 video_id

3.3 图像模型技术细节

基于 API 实测与官方文档：

尺寸约束：

宽度和高度必须为 32 的整数倍
长边 ≤ 2048px
总像素 ≤ ~4,000,000 (约 2K × 2K)

参考图机制：

// 支持多张参考图，通过 Data URI 传入
interface ReferenceImage {
  url: string  // data:image/png;base64,xxxxx
}

并发策略：

最大并发: 3
启动间隔: 1100ms (避免突发请求)
超时: 120s (AbortController)

3.4 视频模型技术细节

基于 GitHub 官方文档：

请求格式：

{
  "model": "agnes-video-v2.0",
  "prompt": "A cinematic shot of a cat walking on the beach at sunset",
  "height": 768,
  "width": 1152,
  "num_frames": 121,
  "frame_rate": 24
}

轮询方式：

GET https://apihub.agnes-ai.com/agnesapi?video_id=<VIDEO_ID>

能力矩阵：文生视频、图生视频、多图视频、关键帧动画

四、竞品对比

4.1 PinchBench 评测对比

PinchBench 是 Agnes AI 官方使用的评测套件，包含三个子榜单：

ClawEval 通用排行榜（文本模型，PASS^3 指标）

模型	PASS^3	排名
Claude Opus 4.6	70.8%	1
GLM 5.1	62.7%	2
Agnes-2.0-Flash	60.9%	3
GPT 5.4	60.2%	4
DeepSeek V4 Pro	58.4%	5

在这里插入图片描述

AA 图改图排行榜（图像模型，Elo 指标）

模型	Elo	排名
GPT Image 2	1250	1
Nano Banana Pro	1240	2
Agnes-Image-2.0	1178	3
Nano Banana	1174	4
FLUX.2 Pro	1169	5

在这里插入图片描述

AA 图生视频排行榜（视频模型，Elo 指标）

模型	Elo	排名
Kling 3.0 Omni	1066	1
Seedance 1.5 Pro	1000	2
Agnes-Video-V2.0	934	3
Wan 2.6	892	4
LTX-2 Pro	878	5

在这里插入图片描述

4.2 国内多模态模型对比

维度	Agnes (Sapiens AI)	通义万相 (阿里)	即梦 (字节)	豆包 (字节)
文本模型	Agnes-2.0-Flash	Qwen-3	豆包 Pro	豆包 Pro
图像模型	Agnes-Image-2.1-Flash	通义万相 2.1	即梦 2.1	Seedream 5.0
视频模型	Agnes-Video-V2.0	Wan 2.1	即梦 Video	Seaweed
API 兼容	OpenAI	DashScope	Volcengine	Volcengine
开源	否	部分开源	否	否
定价	Starter $4/月, Plus $10/月, Pro $50/月	按量计费	按量计费	按量计费
上下文窗口	256K (文本)	128K+	官网未公开	官网未公开
参考图支持	✅ Base64	✅ URL	✅ URL	✅ URL
并发限制	Free 20RPM, Token Plan 1000RPM	按套餐	按套餐	按套餐

4.3 图像生成能力对比

维度	Agnes-Image-2.1	GPT Image 2	Gemini 3 Pro	通义万相 2.1
最大分辨率	~2048×2048	3840×3840	2048×2048	2048×2048
参考图	✅	✅	✅	✅
编辑能力	✅ 图像编辑	✅ inpaint/outpaint	✅	✅
中文理解	✅	一般	待验证	✅ 优秀
API 协议	OpenAI	OpenAI Native	Google	DashScope
定价	4,000 图/天 (Token Plan)	$0.04-0.08/图	按 token	¥0.04/图

4.4 Agnes 的差异化

新加坡本土模型公司，在东南亚市场有地缘和合规优势，不受中国境内 AI 监管限制
模型专为 OpenClaw、Hermes 等智能体工具设计，强调 Agent Harness 能力而非单纯对话
支持企业级私有化部署，提供差异化限流和配额管理
文本、图像、视频三模态统一 API，减少多供应商集成成本

五、定价与配额

5.1 Token Plan 定价

计划	月费	文本请求	图像生成	视频生成
Starter	$4	1,500 次/5小时; 15,000 次/周	4,000 张/天	500 秒/天
Plus	$10	7,500 次/5小时; 75,000 次/周	4,000 张/天	500 秒/天
Pro	$50	30,000 次/5小时; 300,000 次/周	4,000 张/天	500 秒/天

5.2 速率限制（RPM）

文本模型

用户类型	公开请求 RPM	实际执行 RPM
Free / 默认	30	20
Enterprise	60	40
Token Plan	1,000	1,000

图像模型（按分辨率分级）

用户类型	1K RPM	2K RPM	3K RPM	4K RPM
Free / 默认	30 (执行 20)	20 (执行 10)	2 (执行 1)	1 (执行 1)
Enterprise	60 (执行 40)	40 (执行 20)	2 (执行 1)	2 (执行 1)
Token Plan	120 (执行 100)	120 (执行 80)	2 (执行 1)	2 (执行 1)

视频模型

用户类型	公开请求 RPM	实际执行 RPM
Free / 默认	2	1
Enterprise	2	2
Token Plan	6	5

5.3 API Key 限流池

同类型 Key 共享限流池，创建多个 Key 不会增加 RPM 或配额。不同类型 Key 使用独立池。

六、当前免费使用状态

截至 2026 年 6 月，Agnes 三个模型均提供免费层级，无需付费即可使用 API。

6.1 免费层配额

模型	免费 RPM（实际执行）	适合场景
Agnes-2.0-Flash（文本）	20 RPM	对话测试、小规模提示词评估
Agnes-Image-2.1-Flash（图像）	10 RPM（2K）	图像生成实验、概念验证
Agnes-Video-V2.0（视频）	1 RPM	视频生成测试、功能验证

⚠️ 免费层限流较严格：视频模型每秒最多 1 次请求，图像 2K 分辨率每分钟 10 次，文本每分钟 20 次。适合开发调试和概念验证，不适合生产环境。

6.2 免费层与付费层对比

对比维度	Free	Token Plan（Starter $4/月）
文本 RPM	20	1,000
图像 RPM（2K）	10	80
视频 RPM	1	5
文本配额	无固定配额	1,500 次/5小时
图像配额	无固定配额	4,000 张/天
视频配额	无固定配额	500 秒/天

免费层适合技术验证和原型开发。需要更高吞吐量的话，建议升级至 Token Plan。

七、结论与建议

7.1 当前可用方案

推荐优先评估现成的 Agnes skill / MCP 方案（见 2.2 节），已有官方仓库和多个社区实现可直接使用，不必从零开发。MCP 是 Claude Code 的标准扩展协议，配置 .mcp.json 即可声明工具，Claude 自主决策何时调用。若现成方案不满足需求（如缺少视频异步轮询封装、限流策略不匹配），再自研 MCP Server。

7.2 推荐行动

短期：优先评估现成 Agnes skill/MCP 方案（推荐 Yacey/agnes-ai-generation-skill）；图像生成通过 agnes_generate_image 工具调用，视频 API 采用异步轮询模式，需在 MCP 工具中封装 video_id 状态管理
中期：积累使用数据，评估各模型在实际场景中的表现；关注 API 稳定性和限流策略对生产环境的影响
长期：关注官方仓库 AgnesAI-Labs/AgnesAI-Models 是否提供原生 MCP/SDK，以及 Image 2.5 / Video 2.5 Preview 的发布