
😎 网络新闻
英伟达发布 Nemotron 3 Ultra,美国最大的开放权重模型
英伟达发布了 Nemotron 3 Ultra,这是一个 5500 亿参数的开放 MoE 模型(实际激活 550 亿),采用混合 Mamba-Transformer 架构,上下文窗口达 100 万 token。该模型在人工分析智能指数上获得 48 分,为美国开放权重模型中最高,并提供比同类开放 LLM 高达 6 倍的推理吞吐量。权重以 OpenMDW-1.1 协议发布。
MiniMax M3:在一个开放模型中融合顶尖编程能力、百万上下文与原生多模态
上海初创公司 MiniMax 推出了 M3,这是首个将顶尖编程能力(SWE-Bench Pro 上 59%)、百万 token 上下文窗口以及原生多模态能力(包括桌面电脑使用)结合在一起的开放权重模型。MiniMax 稀疏注意力技术将百万上下文下的每 token 计算量降低到上一代的大约 1/20。权重承诺在 10 天内发布。
Claude Opus 4.8:动态工作流与更精准的编程能力
Anthropic 发布了 Claude Opus 4.8,在 Claude Code 中引入了动态工作流——模型会编写编排脚本并启动并行子代理来处理复杂任务。Opus 4.8 在 ARC-AGI-3 上取得最高分(是 GPT-5.5 的三倍

订阅专栏 解锁全文
48

被折叠的 条评论
为什么被折叠?



