
什么是 Sakana Fugu?
Sakana Fugu 是统一指挥的单一模型,可掌控多智能体。它无需依赖单一供应商,就能达到前沿水平的性能,能动态编排全球最优秀的模型,处理复杂的多步骤任务。现在,通过一个 API,就能将集体智能直接融入工作流程。
底层技术
Sakana Fugu 基于 2026 年 ICLR 关于学习模型编排的两篇论文:TRINITY 和 Conductor。这两篇论文展示了系统如何学会为每个任务组合、分配和协调专家智能体,而非依赖手动设计的工作流程。若想深入了解该系统背后的理念,可查看[技术报告](https://github.com/SakanaAI/fugu/blob/main/Fugu_technical_report.pdf)。
- TRINITY:采用轻量级的进化协调器,在多个回合中管理多个大语言模型,为每个模型分配「思考者」「工作者」「验证者」的角色,根据编码、数学、推理和知识等广泛任务,自适应地分配工作。[论文](https://arxiv.org/abs/2512.04695)
- Conductor:通过强化学习训练,能够自主发现基于自然语言的协调策略。通过设计智能体之间的交互模式和精准的提示,它能使多样化的大语言模型集合在高难度的推理基准测试中超越单个模型。[论文](https://arxiv.org/abs/2512.04388)
使用方法
Sakana Fugu 提供 Fugu 和 Fugu Ultra 两个模型,均可通过与 OpenAI 兼容的 API 访问。你可以选择适合工作负载的模型,也可以在不改变集成方式的情况下在两者之间切换。
- Fugu:在高性能和低延迟之间取得平衡,是日常工作的理想标准模型。可将其集成到 Codex 等工具中进行编码和代码审查,或者驱动响应迅速的聊天机器人,所有操作都可通过一个端点完成。还能根据数据、隐私和合规性要求,从模型池中排除特定的智能体。
- Fugu Ultra:协同更广泛的专业智能体池,在高难度和重要问题上提供高质量的答案。早期用户已将其用于 Kaggle 竞赛、论文复现、网络安全分析以及文献和专利调查等场景。
定量结果
两款 Fugu 模型超越了公开可用的前沿模型,在工程、科学和推理等各种具有挑战性的基准测试中,与 Fable 5 和 Mythos Preview 表现相当。而且,它能在不涉及出口管制风险的情况下,展现出前沿水平的实力。
定性结果
将 Sakana Fugu 与 Gemini 3.1 Pro(high)、Opus 4.8(max) 和 GPT 5.5(xhigh) 这三个前沿模型进行对比。为突出行为差异而非特定模型,基线模型匿名表示为 Model A、Model B 和 Model C。
- AutoResearch / 大语言模型学习:AI 智能体借助 AutoResearch 框架自主优化小型 GPT 的训练配方,Fugu - Ultra 在实验中表现出色,最终平均 BPB 优于其他基线模型,最佳单次运行也领先所有基线。
- 假名消息的阅读顺序推定:测试古典日语假名信件阅读顺序的推定,Fugu - Ultra 表现远超其他前沿模型,能几乎准确追踪阅读顺序,而其他模型存在较大差距。
- 鲁比克魔方求解器:Fugu - Ultra 和前沿 Model A 成功编写求解器解决所有 300 个魔方,Fugu - Ultra 在步数上更优,且从未比 Model A 步数更多。
- CAD 机械虹膜:在 CAD 中创建机械虹膜的任务中,Fugu Ultra 生成的 CAD 能清晰地打开和关闭光圈,而其他模型生成的 CAD 存在间隙、连接薄弱或光圈无法完全关闭等问题。
- 盲棋:Fugu 进行四局连续盲棋比赛,战胜了三个前沿模型和 2100 - Elo 的 Stockfish 引擎,在对手失误时保持准确,每局都以将死获胜。
- 股票交易:在股票交易基准测试中,Fugu - Ultra 在 50 周的历史数据窗口内,将投资组合增长至 11,943.22 ± 633.86 美元,平均回报率达 +19.43%,而其他前沿模型回报率均低于 +15%。
用户评价
- 软件工程师:在代码审查中,Fugu Ultra 表现出色,答案全面,能发现其他模型遗漏的错误,已成为代码审查的首选模型。
- 企业研究者:使用 Sakana Fugu 后,能在几个小时内完成原本需要 3 - 4 天的专利态势分析,还发现了以往难以察觉的论文关联。
- 平台企业高管:Sakana Fugu 的原始输出质量与顶尖前沿模型相当,在长时间对话中能保持稳定的角色设定,对智能体产品而言,这一点可能比单纯的基准测试分数更为关键。
- 研究者:只需一个简单指令,Sakana Fugu 就能自主工作约四小时,完成论文阅读、实现、训练、评估和差距分析,在某个 CUDA 任务中,单次会话实现了超 100 倍的加速。
- 安全工程师:只需一个明确范围的指令,Sakana Fugu 就能全面完成安全评估,包括信息收集、XSS/SQLi 检查、认证审查,并生成包含证据和复测步骤的清晰报告,且能严格遵守指定范围,避免进行破坏性操作。
定价
- 按需付费(令牌计划)
- 企业版:适用于对可靠性要求极高的高负载生产工作流程。按使用量计费的令牌,处理优先级高于月订阅计划的令牌。
- Fugu:单个智能体活跃时,按特定基础模型的标准费率支付;多个智能体活跃时,根据涉及的顶级模型收取单一费率。
- Fugu Ultra:fugu - ultra - 20260615 固定定价,输入、输出和缓存输入在不同上下文有不同收费标准。
- 订阅计划
- 月订阅:适合个人用户和日常使用,所有套餐均提供 Fugu 和 Fugu Ultra 两个模型。2026 年 7 月底前订阅,可在初始订阅层级享受第二个月免费。
- 标准套餐:$20 / 月,适合轻量级日常使用,如偶尔调用 API、进行小规模实验或在个人工作流程中试用。
- 专业套餐:$100 / 月,使用量是标准套餐的 10 倍,适合每周的集中工作。
- 高级套餐:$200 / 月,使用量为标准套餐的 20 倍,适用于长时间高负载工作。
- 月订阅:适合个人用户和日常使用,所有套餐均提供 Fugu 和 Fugu Ultra 两个模型。2026 年 7 月底前订阅,可在初始订阅层级享受第二个月免费。
常见问题解答
- Q1:Sakana Fugu 支持通过与 OpenAI 兼容的 API 访问。你只需将现有客户端或编码工具,结合 API 密钥指向 Fugu 端点,即可发送请求,无需迁移 SDK。
- Q2:Fugu 兼顾延迟和质量,是日常编码和交互工作的理想标准模型。Fugu Ultra 则在复杂多步骤推理中优先保证答案质量,在对精度和深度要求较高的场景下,会协同更多专业智能体,但响应时间可能较长。
- Q3:Fugu Ultra 为保证性能,使用固定的智能体池。而 Fugu 允许你通过控制台页面的设置菜单,排除特定模型,以满足数据、隐私和合规性要求。
- Q4:新的前沿模型发布后,预计用约两周时间完成更新版 Sakana Fugu 模型的训练和评估,随后逐步提供服务。
- Q5:提供订阅和按需付费两种计划,均可使用 Fugu 和 Fugu Ultra。订阅计划有三个月套餐,按需付费计划按令牌使用量计费,提供灵活的容量,适合企业用户。
- Q6:Sakana Fugu 的定价是基于活跃智能体池的单一综合费率,而非各模型费用之和。增加智能体不会增加费用,只是确定适用的单一模型费率。
- Q7:每次请求都会报告令牌使用量和对应成本,你可以实时监控费用,并在业务扩展前预估成本。
- Q8:你可以随时在控制台页面选择是否将数据用于模型训练。若你愿意分享数据,将有助于提升 Sakana Fugu 的性能。
- Q9:Sakana Fugu 选择具体模型和协调方式属于专有技术,设计上不对外公开路由信息。
- Q10:Sakana Fugu 支持日本以外地区使用。但目前不向欧盟(EU)和欧洲经济区(EEA)成员国提供服务(详情见服务条款)。其他地区可能因网络或当地法规限制无法使用。
联系我们
如需了解访问方式、套餐详情和企业级部署方案,请与我们联系。[立即开始使用 Sakana Fugu](https://console.sakana.ai/login) 联系我们:[fugu - support@sakana.ai](mailto:fugu - support@sakana.ai)

© 2026 Sakana AI 株式会社

被折叠的 条评论
为什么被折叠?



