Google ADK + LiteLLM 本地api流式输出踩坑记录

原创

已于 2026-07-03 11:59:35 修改 · 168 阅读

收录于

当前文章被以下社区和专栏收录：

于 2026-07-03 11:59:34 首次发布

一、问题现象

1.1 环境配置

组件	版本/说明
框架	Google ADK (adk-python)
模型适配器	LiteLlm（ADK 内置的第三方模型适配层）
模型	阿里云 qwen3.7-max（通过 DashScope OpenAI 兼容接口）
后端	FastAPI + SSE (Server-Sent Events)
前端	原生 HTML + JS + marked.js

1.2 问题描述

用户发送一条简单消息（如"你能干什么"），预期效果是逐字流式输出，实际效果是：

<span style="background-color:#e1e1e1">[等待 5~10 秒] → 完整响应一次性出现</span>

没有任何逐 token

标签

#python #google ADK #流式输出 #SSE #Agent

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SharonJYS

关注关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

手把手教你用Google ADK和DeepSeek打造你的第一个AI助手（附完整代码）

weixin_30342209的博客

03-25

391

本文详细介绍了如何使用Google ADK框架和DeepSeek大模型构建AI助手，从开发环境搭建到核心设计解析，再到深度集成DeepSeek模型，最后实现一个多功能天气时间助手。文章提供了完整的代码示例和调试技巧，帮助开发者快速掌握Agent开发的核心技术。

避开这3个坑！用FastAPI部署Google ADK智能体的血泪经验总结

weixin_29234239的博客

03-17

本文总结了使用FastAPI部署Google ADK智能体时常见的三个陷阱：性能瓶颈、会话管理混乱和跨域配置不当，并提供了详细的优化方案和实战数据。通过智能体预热、流式响应改造和Redis会话存储等优化措施，性能从每秒3请求提升至300+，适用于企业级多智能体开发场景。

参与评论您还未登录，请先登录后发表或查看评论

Google ADK 实战：用 Python 搭一个多 Agent 协作系统

baidu_32885171的博客

05-06

547

Google 在 Cloud Next 2026 上发布了 Gemini Enterprise Agent Platform，面向开发者的核心组件是 Agent Development Kit（ADK）。这篇跳过发布会 PPT，直接上手：从安装到跑通多 Agent 协作，全程记录实际操作和踩坑。

ADK多智能体旅行规划器：A2A协议与本地可调试架构实战

weixin_34408717的博客

06-23

379

多智能体系统（MAS）是构建复杂AI应用的核心范式，其本质在于通过职责分离、接口契约与异步协作提升系统鲁棒性与可维护性。ADK（Agent Development Kit）以标准化Agent-to-Agent（A2A）协议为基石，将每个Agent建模为具备健康检查、结构化输入输出和元数据发现能力的轻量服务，显著降低LLM与REST混合编排的工程复杂度。该框架强调本地可调试的端到端验证闭环，支持FastAPI微服务部署与Streamlit声明式UI快速集成，适用于旅行规划、资源调度、智能客服等需多角色协同决策

【办公类-53-11】20260701Python模仿制作2026学年第一学期校历（excel+pdf，上下学期都包含）

reasonsummer的博客

07-02

162

【办公类-53-11】20260701Python模仿制作2026学年第一学期校历（excel+pdf，上下学期都包含）

实时电影票房API接入实战：从0搭建票房监控看板

Roufsi的博客

07-01

266

本文深入讲解如何使用实时电影票房API，通过Python或Rust快速获取当日票房数据，并利用ECharts构建动态监控看板。涵盖API申请、认证、数据解析与可视化全流程，附完整可运行代码，帮助开发者零门槛接入电影票房数据服务。

15_项目实战一_用LangChain搭建个人知识库问答助手

yang13739765227的博客

06-29

2053

文档 -> 切分 -> 向量化 -> 向量库 -> 检索 -> 拼 Prompt -> 模型生成答案但真正做一个个人知识库问答助手时，你会发现问题不止这些。用户不是只放一个.txtPDF 论文。Word 需求文档。Markdown 技术笔记。会议纪要。项目说明。API 文档。个人学习资料。这篇文章讲了什么？根据我上传的所有资料，LangGraph 和 LangChain Agent 的区别是什么？支持多格式文档加载。自动切分长文档。为每个 chunk 保存来源信息。

Claude Code Skills实战：Andrej Karpathy 149K Stars项目深度解析

小二丶的博客

07-02

160

《Andrej Karpathy开源Claude Code Skills项目解析》摘要：前Tesla AI总监Andrej Karpathy开源的Claude Code Skills项目在GitHub单月斩获149K Stars，成为历史增长最快项目之一。该项目通过CLAUDE.md文件定义了AI编码的核心规范，解决了LLM编程中的四大陷阱：错误假设、过度复杂化、跳过测试和随意修改。

用网线，与麒麟linux相互拷贝

natural_Caduceus

06-29

481

如果文件较大或包含敏感数据：强烈建议使用SCP，因为它是加密传输，且 Win11 原生支持，操作最简便。如果只是临时传几个小文件，且不想处理 SSH 权限：使用更加轻量快捷。图形化需求：如果你更喜欢拖拽操作，也可以在 Win11 上下载WinSCP或FinalShell，通过输入和麒麟账号密码，直接可视化地把文件拖到 Win11 本地。

最新零基础做量化，先按能力选择工具再看 Python API

zhangnihi的博客

06-29

219

读完后，读者应理解工具选择不是越复杂越好，而是要先匹配当前能力，再把Python、API、数据和执行流程放进同一条学习线里看。

博客系统测试

Shengmc的博客

07-02

204

本项目为 Web 端博客管理系统，支持访客未登录浏览、登录用户发布 / 编辑 / 删除个人博客、查看他人博客等核心业务，包含四大核心页面：登录页面、博客列表主页、博客详情页、博客编辑页。测试覆盖登录权限控制、页面渲染、博客编辑发布、访客拦截等全场景。

Spring Boot :将自定义的 JAR 包引入到 Maven 项目中

qq_43515713的博客

07-03

207

在开发Spring Boot项目时，我们经常需要引入第三方库或自定义的JAR包来扩展功能。

2026年GPT-Image-2完整接入教程：从注册到出图的全流程实操

2609_96127826的博客

07-01

519

GPT-Image-2代表了2026年AI图像生成的技术水准，尤其在中文文字渲染和多轮对话编辑方面具备显著优势。对于国内开发者，接入流程可以概括为三步：选择合规聚合平台获取API Key、用OpenAI SDK对接接口、通过quality参数平衡成本与效果。建议从low quality开始批量测试，确认构图和文字效果后再切高质量出图。电商、设计、内容创作等高频场景的开发者，值得尽早完成从DALL·E 3到GPT-Image-2的迁移——中文渲染能力的提升，足以改变整个工作流的效率。

FastAPI 基础篇：类型注解驱动的 Python Web 开发范式

m0_73777119的博客

06-30

534

这篇文章全面的讲解了fastapi的基础知识，从宏观到详细的知识点。

深入Python元编程：Metaclass实战与高级应用揭秘

huozhe01的博客

07-01

191

元类是Python元编程的巅峰，通过重写或__call__，我们可以在类创建和实例化阶段注入自定义行为。本文展示的自动属性修改、单例、接口校验、自动注册和日志记录等实战案例，覆盖了框架开发中最常用的场景。然而，能力越大责任越大，在使用元类前，务必权衡是否可以用更简单的方案达到目的。当你确实需要对类的创建过程进行深度控制时，让元类成为你的撒手锏吧！

外包干了5天，技术明显退步

2301_79535733的博客

07-01

293

他了解我的困境后，并没有直接给我提供工作机会，而是给了我一个网盘链接，里面包含了一整套软件测试面试必备文档PDF和完整的学习路线视频教程。两年的功能测试工作并没有让我积累到足够的技术实力，反而让我陷入了思维定势，难以适应新的技术挑战。面对大厂严格的面试要求，我感到无从下手，甚至开始怀疑自己的能力。整份文档一共有将近 200 页，全部为大家展示出来肯定是不太现实的，为了不影响大家的阅读体验就只展示了部分内容，还望大家海涵，希望能帮助到您面试前的复习且找到一个好的工作，也节省大家在网上搜索资料的时间来学习.

【AI大模型应用开发】【项目实战】12.基于ChatGlm-6b实现新媒体行业文本评论分类与信息抽取系统

zhoupenghui168的博客

07-01

204

本文介绍了基于ChatGLM-6B模型和LoRA微调方法的新媒体行业文本分类与信息抽取项目。项目针对新媒体行业海量信息处理需求，通过微调预训练模型实现对文本评论的分类和结构化信息抽取。文章详细阐述了技术选型、数据处理流程、模型配置及训练方法，并提供了完整的代码实现。项目采用LoRA高效微调技术，在保持模型性能的同时大幅降低计算资源需求，最终实现了对文本内容的高效分类和关键信息提取，为新媒体行业信息管理提供了实用解决方案。

Python Sqlalchemy学习——新增/修改/删除

weixin_44706420的博客

06-30

本文介绍图书管理系统中新增、修改和删除操作的实现。新增书籍时先检查书名是否重复；修改操作支持单个书籍信息更新和批量价格调整；删除功能通过ID定位书籍记录。所有操作均使用异步数据库会话管理，包含必要的存在性校验，并返回明确的操作结果提示。代码采用Python异步SQLAlchemy实现，展示了完整的CRUD功能示例。

python-musl交叉编译