dashscope.Generation 是用于 纯文本模型(如 qwen-max、qwen-turbo) 的接口。 而 qwen-vl-max 是一个多模态视觉语言模型(支持图像输入),必须使用专门的多模态接口: ✅ 正确类:dashscope.MultiModalConversation.call(...)