Qwen3.5 要来了

原创于 2026-02-09 16:20:54 发布 · 642 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#java #数据库 #开发语言 #人工智能

Qwen3.5-9B

Qwen3.5 具备以下增强特性：统一的视觉-语言基础：通过在多模态 token 上进行早期融合训练，在跨代性能上与 Qwen3 持平，并在推理、编码、智能体和视觉理解等基准测试中全面超越 Qwen3-VL 模型。高效混合架构：结合门控 Delta 网络与稀疏混合专家（Mixture-of-Experts），实现高吞吐推理，同时保持极低的延迟和成本开销。可扩展的强化学习泛化能力：在百万

Qwen3.5、MiniMax2.2、字节跳动 Seed、DeepSeek-V4 都要来了吗？

最近，LMSYS Chatbot Arena（目前的“大模型盲测”权威榜单）上又热闹起来了。

除了大家熟知的名字，榜单上突然窜出了几个神秘的匿名模型，它们虽然披着代号的“马甲”，但在对话中却诚实地“自报家门”。

Qwen 3.5 现身：代号 “Karp”

在 Arena 上，代号为 Karp-001 和 Karp-002 的模型，在被问及身份时，明确回答自己是 Qwen 3.5（阿里通义千问的下一代大版本）。

与之呼应的是，GitHub 上的 transformers 库中也悄然出现了 Qwen 3.5 的配置文件：

Qwen3.5-9B-Instruct
Qwen3.5-35B-A3B-Instruct

其中，35B 版本的 “A3B” 后缀引人遐想，这很可能暗示了 Active 3B（激活参数为 3B）的 MoE（混合专家）架构。如果属实，这将是阿里在轻量级 MoE 模型上的又一次重要尝试，兼顾了高性能与推理效率。

字节新动作：代号 “Pisces”

不仅仅是阿里，字节跳动似乎也有新动作。

竞技场上出现了 Pisces-llm-0206a 和 Pisces-llm-0206b，它们自称是字节跳动的 “Seed” 模型。这可能是 Seed 系列的全新迭代或测试版本，日期后缀 0206 暗示了这是非常新鲜的 checkpoint。

Karp-001：I’m Qwen3.5, developed by Tongyi Lab.
Pisces 系列：I’m Seed, a large language model developed by ByteDance.

Pisces 模型用不到 100 行代码就画出了一个很漂亮的 Xbox 手柄 SVG，而 Karp 用了 600+ 行还画得一般

暗示 Pisces 在代码/创意生成上明显更强

春节将至，大模型圈的“春招”似乎比人才市场还要火热。

阿里和字节不约而同地在竞技场上测试新模型，预示着新一轮的“千模大战”又要开始了。

字节系

Seed 2.0
Seed 2.0 Flash
Seed Code 2

阿里 Qwen 系

Qwen3.5 models

DeepSeek 系

DeepSeek-V4
DeepSeek-V4-Lite

大模型春节也要来了！

您可能感兴趣的与本文相关的镜像

Qwen3.5-9B

Qwen3.5-9B

文本生成

Qwen

Qwen3.5

Qwen3.5 具备以下增强特性：统一的视觉-语言基础：通过在多模态 token 上进行早期融合训练，在跨代性能上与 Qwen3 持平，并在推理、编码、智能体和视觉理解等基准测试中全面超越 Qwen3-VL 模型。高效混合架构：结合门控 Delta 网络与稀疏混合专家（Mixture-of-Experts），实现高吞吐推理，同时保持极低的延迟和成本开销。可扩展的强化学习泛化能力：在百万

机器学习算法与Python实战

博客等级

码龄12年

企业官方账号

361
原创

2023
点赞

4138
收藏

1万+
粉丝

关注

私信

TA的精选

新云端 AI Agent 实测：数据分析→PPT→视频，一个输入框跑完整个项目
463 阅读
新首个接入Seedance 2.0 视频生成 API 的龙虾来了，Windows&Mac
661 阅读
热手把手教你配置JupyterLab 环境
17455 阅读
热深度研究：回归模型评价指标R2_score
14222 阅读
热太骚了，用Excel玩机器学习
8938 阅读

TA的历史创作历程

分类专栏

上一篇：: Windows 版 Claude Cowork 来了！这个桌面 Agent，正在接管我的电脑

下一篇：: 首个接入Seedance 2.0 视频生成 API 的龙虾来了，Windows&Mac

官方同款运行环境

Qwen3.5-9B

Qwen3.5 具备以下增强特性：统一的视觉-语言基础：通过在多模态 token 上进行早期融合训练，在跨代性能上与 Qwen3 持平，并在推理、编码、智能体和视觉理解等基准测试中全面超越 Qwen3-VL 模型。高效混合架构：结合门控 Delta 网络与稀疏混合专家（Mixture-of-Experts），实现高吞吐推理，同时保持极低的延迟和成本开销。可扩展的强化学习泛化能力：在百万

文本生成

Qwen

Qwen3.5

显存大小

24GB

CPU

10核心

内存

120GB

系统盘/数据盘

40GB

无需本地环境部署，可直接运行

· AI 阅读助手

目录

展开全部

收起

官方同款运行环境

Qwen3.5-9B

Qwen3.5 具备以下增强特性：统一的视觉-语言基础：通过在多模态 token 上进行早期融合训练，在跨代性能上与 Qwen3 持平，并在推理、编码、智能体和视觉理解等基准测试中全面超越 Qwen3-VL 模型。高效混合架构：结合门控 Delta 网络与稀疏混合专家（Mixture-of-Experts），实现高吞吐推理，同时保持极低的延迟和成本开销。可扩展的强化学习泛化能力：在百万

文本生成

Qwen

Qwen3.5

显存大小

24GB

CPU

10核心

内存

120GB

系统盘/数据盘

40GB

无需本地环境部署，可直接运行

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。