一、问题现象
1.1 环境配置
| 组件 |
版本/说明 |
|---|---|
| 框架 |
Google ADK (adk-python) |
| 模型适配器 |
LiteLlm(ADK 内置的第三方模型适配层) |
| 模型 |
阿里云 qwen3.7-max(通过 DashScope OpenAI 兼容接口) |
| 后端 |
FastAPI + SSE (Server-Sent Events) |
| 前端 |
原生 HTML + JS + marked.js |
1.2 问题描述
用户发送一条简单消息(如"你能干什么"),预期效果是逐字流式输出,实际效果是:
<span style="background-color:#e1e1e1">[等待 5~10 秒] → 完整响应一次性出现</span>
没有任何逐 token

391

被折叠的 条评论
为什么被折叠?



