1.3 产品架构概述——WorkBuddy 是怎么设计和实现的?
本文是《唤醒你的 AI 同事——WorkBuddy 从零上手》系列 第三篇。
📖 上一节回顾:四大核心能力
在上篇文章「1.2 核心能力一览」中,我们拆解了 WorkBuddy 的 四大核心能力:对话、执行、记忆、协作。你了解到它不仅能听懂人话、能动手做事,还能记住你的偏好和项目上下文,更能连接外部工具执行复杂任务。
但你可能会有一个疑问: 它到底是怎么做到的?
一个能执行代码、能操作文件、能连接外部服务、还能记住上下文的 AI 同事,它的背后架构是什么样的?
这就是本节我们要回答的问题。我们会从 客户端-服务端架构、模型层、技能层、连接器层、数据存储与安全机制 五个维度,逐一揭开 WorkBuddy 的技术面纱。
1.3 产品架构概述
一、总体架构:客户端-服务端两层架构
WorkBuddy 采用的是 客户端-服务端(Client-Server)两层架构。
简单来说,它由两个部分组成:
- 客户端(Client):安装在你电脑上的桌面应用,是你的"AI 同事"的"工作台面"
- 服务端(Server):云端的服务集群,是你的"AI 同事"的"大脑"和"工具箱"

图 1.9 WorkBuddy 的总体架构:客户端-服务端两层设计
1.1 客户端:你的"工作台"
客户端是 WorkBuddy 的用户界面,是你每天直接交互的部分。它负责:
- 接收你的输入:文字、文件、截图、语音
- 展示执行结果:生成的文档、图表、报告
- 管理本地资源:文件浏览、代码编辑器、历史记录
- 发起网络请求:与服务端通信,调用技能和连接器
你可以把客户端理解为 WorkBuddy 的"身体"——它负责感知、执行和呈现。
1.2 服务端:你的"大脑"
服务端是 WorkBuddy 的智能引擎,它负责:
- AI 模型推理:理解你的需求、生成代码、撰写文档
- 技能执行:运行各种专业技能的逻辑
- 连接器管理:与外部服务(腾讯文档、邮箱等)通信
- 记忆存储:保存对话历史、项目上下文、用户偏好
你可以把服务端理解为 WorkBuddy 的"大脑"——它负责思考、分析和决策。
1.3 两者如何协作?
典型的请求-响应流程:
你在客户端输入:"帮我分析这份数据并生成报告。"
↓
客户端将请求发送给服务端
↓
服务端:
1. 理解你的意图(模型层)
2. 调用数据分析技能(技能层)
3. 执行代码分析数据(执行能力)
4. 生成报告和图表(技能层)
5. 将结果返回给客户端
↓
客户端展示结果给你
AI写代码
1234567891011121314
二、模型层:WorkBuddy 的"大脑"
模型层是 WorkBuddy 的核心智能引擎,负责理解你的需求、生成代码、撰写文档、做出决策。

图 1.10 模型层:WorkBuddy 的"大脑",支持多种 AI 模型
2.1 多模型支持
WorkBuddy 不是单一模型,而是支持多种主流 AI 模型的混合平台:
模型名称提供方典型优势适用场景GPT-4 / GPT-4oOpenAI综合能力强、代码生成优秀通用任务、代码编写ClaudeAnthropic逻辑推理长文本处理复杂分析、文档撰写GeminiGoogle多模态理解图文分析、创意设计通义千问阿里中文理解强、性价比高中文文档、办公自动化文心一言百度中文生态完善国内业务场景
2.2 模型如何选择?
不同模型有不同特长,你可以根据需求切换:
• 写代码 → 选 GPT-4o(代码生成能力强)
• 分析长文档 → 选 Claude(上下文窗口大)
• 中文办公场景 → 选通义千问(性价比最优)
• 多模态任务 → 选 Gemini(理解图片和视频)
AI写代码
1234567
三、技能层:WorkBuddy 的"工具箱"
技能层是 WorkBuddy 的专业能力集合,每个"技能"代表一项专门的工作能力。

图 1.11 技能层:WorkBuddy 的"工具箱",每项技能代表一种专业能力
3.1 内置技能
WorkBuddy 自带一组开箱即用的常用技能:
技能类别代表技能适用场景文档处理PDF 提取、Word 生成、PPT 创建、Excel 数据分析开发辅助代码审查、Bug 定位、API 文档生成数据分析数据清洗、可视化、统计检验多媒体图片生成、视频生成、3D 模型创建
3.2 自定义技能
除了内置技能,WorkBuddy 还支持自定义技能——你可以根据自己的需求创建专属技能:
举例:你创建了一个"合同审查"技能
Step 1 → 上传一份合同 PDF
Step 2 → 自动识别风险条款并标注
Step 3 → 生成修改建议和修订版本
Step 4 → 输出审查报告
AI写代码
12345678
一旦配置完成,以后每次只需说"审查这份合同",WorkBuddy 就会自动调用该技能。
3.3 技能市场
WorkBuddy 还提供技能市场(Skill Marketplace),用户可以:
- 浏览他人分享的实用技能
- 一键安装技能到自己的 WorkBuddy
- 发布自己的技能供社区使用
四、连接器层:WorkBuddy 的"人脉网络"
连接器层是 WorkBuddy 连接外部世界的桥梁。通过连接器,WorkBuddy 可以操作你日常使用的各种服务和平台。

图 1.12 连接器层:WorkBuddy 的"人脉网络",连接所有外部服务
4.1 常见连接器
连接器类型典型代表连接能力腾讯文档创建、编辑、分享在线文档,智能表单QQ 邮箱收发邮件、管理联系人、邮件搜索数据库MySQL、PostgreSQL 等数据查询和写入Git版本控制、代码审查、提交分析云盘腾讯微云等文件上传下载分享项目管理TAPD、Jira 任务状态同步、进度追踪
4.2 连接器的工作原理
举例:你让 WorkBuddy "给我发一封邮件"
流程:
1. WorkBuddy 理解你的需求(模型层)
2. 检查 QQ 邮箱连接器是否已配置(连接器层)
3. 调用邮箱 API 起草邮件(连接器层)
4. 将起草完成的邮件展示给你确认(客户端)
5. 确认后发送给收件人(连接器层)
AI写代码
12345678910
4.3 连接器的配置与管理
每个连接器需要独立认证,确保数据安全:
- 首次使用时需要你登录对应服务并授权
- 敏感操作(如发送邮件、写入数据库)需要你确认
- 连接器可以按需开启或关闭
五、数据存储与安全机制
5.1 三层数据存储架构

图 1.13 数据存储架构:本地、云端、外部三层分离
| 存储层级说明典型数据类型本地存储你的电脑硬盘上,速度快、隐私性好对话历史、缓存文件、配置信息云端存储服务端加密存储,跨设备同步项目上下文、技能配置、连接器凭证外部存储第三方服务的数据服务器你的邮件、文档、数据库记录
5.2 数据安全与权限管理
WorkBuddy 采用四级权限模型来控制不同操作的安全级别:

图 1.14 安全权限架构:四级权限模型保障数据安全
权限级别名称说明典型操作L1 仅本地不涉及外部服务,仅操作本地文件打开文件、重命名、本地转换L2 用户授权需要用户明确确认的操作执行代码、修改文件内容L3 连接器认证需要外部服务认证的敏感操作发送邮件、写入数据库L4 最高权限涉及资金、账号安全的极端敏感操作(需多重确认)修改密码、财务操作
5.3 隐私保护机制
| 隐私措施说明数据加密传输中和本地存储均使用 AES-256 加密最小权限原则连接器只获取完成任务所需的最小权限本地优先策略敏感数据默认存储在本地的,不上传云端会话隔离不同项目的对话数据彼此隔离
六、小结:架构如何支撑四大能力?
回过头来看,WorkBuddy 的架构是如何支撑我们之前讲的 四大核心能力 的?
能力架构支撑对话能力模型层(理解自然语言)+ 客户端(输入输出界面)执行能力技能层(专业工具)+ 连接器层(外部服务)+ 客户端(操作文件)记忆能力云端存储(持久化)+ 本地存储(缓存)协作能力连接器层(连接外部)+ 技能层(组合执行)+ 服务端(调度)
七、下一节预告
了解了 WorkBuddy 的架构之后,你可能会好奇:
“它跟 ChatGPT、Copilot 这些工具到底有什么不同?”
👉 1.4 与其他 AI 工具的对比——我们从定位、能力边界、技术架构、生态整合四个维度,逐一对比 WorkBuddy 与主流 AI 工具的异同,帮你更清晰地判断"该选哪个"。
《唤醒你的 AI 同事》系列连载中,欢迎关注不迷路!
上一篇文章: 1.2 核心能力一览
系列导航: 0. 前言及目录
28

被折叠的 条评论
为什么被折叠?



