1.2 核心能力一览——WorkBuddy 到底能帮你做什么?
本文是《唤醒你的 AI 同事——WorkBuddy 从零上手》系列第二篇。
📖 上一节回顾:WorkBuddy 是什么?
在上篇文章「1.1 产品定位与核心价值」中,我们把 WorkBuddy 定义为一位**“AI 同事”**——不是只会聊天的机器人,而是真正能帮你干活的伙伴。我们讨论了它的核心价值:降本增效、知识沉淀、流程自动化。
但你可能会有一个疑问:它到底是怎么做到这些的?它的本事从何而来?
这就是本节我们要回答的问题。本节我们将逐一拆解 WorkBuddy 的四大核心能力:对话、执行、记忆、协作。
1.2 核心能力一览
一、四大核心能力总览
WorkBuddy 就像一个真正的职场老员工,具备四项基本素质:
| 能力 | 一句话总结 | 类比真人 |
|---|---|---|
| 对话能力 | 听得懂人话,能进行多轮对话 | 能沟通 |
| 执行能力 | 能动手做事,不只是嘴上说说 | 能干活 |
| 记忆能力 | 记住你的偏好和上下文 | 有经验 |
| 协作能力 | 能连接外部工具,搞定复杂事 | 有资源 |

图 1.4 WorkBuddy 的四大核心能力:对话、执行、记忆、协作
这四个能力层层递进,构成了 WorkBuddy 作为一个完整"AI 同事"的能力体系。下面我们来逐一深入了解。
二、对话能力:理解自然语言,进行多轮对话
对话能力是 WorkBuddy 最基础的能力。它让你能用自然语言——就像跟真人说话一样——下达任务,而不需要学习任何编程语言或命令格式。
2.1 什么叫"听懂人话"
想象一下,你的新同事小王来了第一天,你跟他说:“帮我把这份合同的风险条款标出来。”
小王能听懂吗?当然能。因为他理解自然语言。
WorkBuddy 也一样。
你说:"帮我整理这份合同的风险条款,用红色标注,写一份摘要发给王经理。"
WorkBuddy 理解了三件事:
1. 读取合同文件 → 执行操作
2. 识别风险条款 → 红色高亮
3. 写摘要发邮件 → 发送给王经理
这不是简单的关键词匹配,而是真正理解你的意图,并把它拆解成可执行的步骤。
2.2 多轮对话:从"一问一答"到"连续协作"
WorkBuddy 不只是"我问一句,它答一句"。它能理解上下文,和你进行连贯的多轮对话。
第一轮: "帮我分析一下上个季度的销售数据。"
→ WorkBuddy 拉取数据,生成分析报告
第二轮: "好的,哪个产品贡献最大?"
→ "贡献最大的是旗舰产品线,占比34.2%。"
第三轮: "跟去年同期比呢?"
→ "同比增长12.8%,主要是新品类的拉动。"
第四轮: "把这张对比图表导出为 PNG。"
→ "已完成,保存在桌面。"
注意:你没有在任何一轮对话中重新说明"上季度"是哪个季度、"这个产品"指的是什么。WorkBuddy 记住了上下文,让对话保持了连贯性。
2.3 支持的输入方式
WorkBuddy 不止接受纯文本输入,还支持多种方式:
| 输入方式 | 说明 | 典型场景 |
|---|---|---|
| 纯文本输入 | 直接输入自然语言 | 绝大部分任务 |
| Markdown 文本 | 支持格式化(标题、代码块、列表) | 结构化任务描述 |
| 文件上传 | 上传文档、表格、PDF 等 | 需要 WorkBuddy 分析的内容 |
| 图片上传 | 截图、照片、扫描件 | 图片内容识别与分析 |
| 语音输入 | 语音转文字 | 不方便打字时(如通勤路上) |
多种输入方式的组合使用让沟通更加灵活:
组合场景示例:
Step 1 → 上传一张手机截图(合同条款)
Step 2 → 输入文字:"识别图片中的风险条款"
Step 3 → 再上传一个 Excel 文件:"对比这个文件的数据"
Step 4 → "综合以上两份材料,写一份评估报告"

图 1.5 对话能力:从需求描述到多轮追问,一气呵成
三、执行能力:不只是说,而是做
如果说对话能力是 WorkBuddy 的"嘴",那执行能力就是它的"手"。
这是 WorkBuddy 与所有其他聊天机器人最大的区别。
3.1 代码执行:写代码、跑代码、交结果
WorkBuddy 可以自动生成并执行代码,完成各种数据处理、文件转换、自动化任务。
举个例子:你说一句话,WorkBuddy 帮你画图。
你说:"帮我用这段数据画一个折线图,展示每月的增长趋势。"
WorkBuddy 自动完成:
1. 理解你的需求
2. 自动生成 Python 代码
3. 执行代码
4. 把图表 PNG 文件交给你
你不需要懂 Python,不需要知道怎么安装 matplotlib 库,不需要处理各种报错。WorkBuddy 帮你写、帮你跑、直接把图表交给你。
3.2 文件操作:直接操作本地文件
WorkBuddy 可以直接操作你授权范围内的本地文件,完成各种批量处理任务:
| 操作类型 | 示例 |
|---|---|
| 批量重命名 | “把所有照片按拍摄日期重命名” |
| 格式转换 | “把这100个 TXT 文件转换成 PDF” |
| 内容提取 | “从文件夹里所有 Word 文档中提取表格” |
| 文件整理 | “按文件类型和日期分类整理这个文件夹” |
| 内容合并 | “把这20个 Excel 表格合并成一个” |
3.3 API 调用:连接外部服务
WorkBuddy 可以连接外部服务,调用 API 完成任务:
- 创建腾讯文档并写入内容
- 发送邮件到指定收件人
- 查询数据库并生成报告
- 更新项目管理工具中的任务状态
3.4 多步骤任务编排:自主规划,全自动执行
WorkBuddy 最强大的地方在于它能自主规划多步骤任务。
你的请求:
"整理这个项目文件夹里所有的文档,
把 Word 转换成 PDF,提取每个文档的标题和摘要,
做成一份目录索引。"
WorkBuddy 的自动规划与执行:
Step 1 → 扫描指定文件夹中的所有文件
Step 2 → 筛选出 Word 文档(.doc/.docx)
Step 3 → 逐个读取每个 Word 文档
Step 4 → 提取标题(第一个标题)和摘要(前300字)
Step 5 → 将每个 Word 文档转换为 PDF
Step 6 → 生成 Markdown 格式的目录索引文件
Step 7 → 输出两个结果:
→ PDF 文件夹(所有转换后的 PDF)
→ 目录索引.md(所有文档的标题和摘要)
这就是"执行能力"的含义:不是给你一个建议,而是把整件事做完。

图 1.6 执行能力:从一句话到多步自动执行,最终交付成果
四、记忆能力:记住你的偏好和项目上下文
4.1 对话记忆:越聊越懂你
WorkBuddy 会记住你们之间的对话历史,这样在后续对话中就不需要重复背景信息。
周一 上午: "我正在做一个关于航空应急救援的项目,
主要研究直升机在山地救援中的应用。"
周四 下午: "帮我在上周写的文档基础上,再补充一个章节,
写山地救援直升机的选型标准。"
→ WorkBuddy 知道:
- "上周写的文档"是指航空应急救援项目
- "这个章节"要写直升机选型标准
- 不需要你重新解释项目背景
4.2 偏好记忆:了解你的工作风格
WorkBuddy 会逐渐记住你的个人偏好:
| 记忆内容 | 举例 |
|---|---|
| 写作风格 | 你喜欢正式的公文语气,还是轻松的口语化风格? |
| 格式要求 | 报告要不要摘要?标题用几级?要不要加目录? |
| 图表偏好 | 你喜欢柱状图还是折线图?用什么配色? |
| 术语习惯 | 你们公司内部叫什么?(如"OKR"叫"目标与关键结果"还是直接用缩写) |
4.3 项目记忆:完整的项目上下文
对于复杂项目,WorkBuddy 可以保存项目级上下文:
项目:航空应急救援分会峰会筹备(6月27日)
记住的关键信息:
✓ 峰会日期和地点
✓ 课题编号:4、7、11
✓ 每个课题的展示重点和目标受众
✓ 相关文件和素材的位置
✓ 之前的决策和修改记录
✓ 对接人和联系方式
当你说"那个峰会的视频",WorkBuddy 自动知道
你指的是哪个项目、哪份文件、哪个时间节点。

图 1.7 记忆能力:从个人偏好到项目上下文,越来越懂你的 WorkBuddy
五、协作能力:连接外部工具,执行复杂任务
5.1 连接器(Connector):连接你日常用的所有服务
通过连接器,WorkBuddy 可以连接你日常工作用到的各种平台和服务:
| 连接器 | 能力 | 典型场景 |
|---|---|---|
| 腾讯文档 | 创建、编辑、分享在线文档 | 生成会议纪要、共享文档 |
| QQ 邮箱 | 收发邮件、管理联系人 | 自动发送报告、邮件分类 |
| 数据库 | 查询/写入数据 | 数据导出、报表生成 |
| Git | 版本控制操作 | 代码审查、提交记录分析 |
| 云盘 | 文件上传/下载/分享 | 批量文件整理和分发 |
| 项目管理工具 | TAPD、Jira 等 | 任务状态同步、进度追踪 |
5.2 技能(Skill):你的数字工具箱
技能是 WorkBuddy 的"工具箱",每个技能提供一项专门的能力:
| 技能类别 | 代表技能 | 适用人群 |
|---|---|---|
| 文档处理 | PDF 提取、Word 生成、PPT 创建、Excel 分析 | 所有办公人员 |
| 开发辅助 | 代码审查、Bug 定位、API 文档生成 | 程序员、测试人员 |
| 内容创作 | 博客文章生成、SEO 优化、多语言翻译 | 运营、市场、写作者 |
| 数据分析 | 数据清洗、可视化、统计检验 | 数据分析师、研究员 |
| 多媒体 | AI 图片生成、视频生成 | 设计师、创作者 |
5.3 协同执行:打通全流程的复杂任务
WorkBuddy 最让人惊喜的能力,是将多个技能和连接器组合起来,执行跨平台、多步骤的复杂任务:
你的请求:
"每天早上9点,自动做这几件事:
1. 从数据库拉取昨天的销售数据
2. 分析关键指标并生成图表
3. 生成一份 PDF 日报
4. 通过邮件发给管理层
5. 发到团队微信群"
WorkBuddy 的执行流程:
① [数据库连接器] → 查询昨日销售数据
② [数据分析技能] → 清洗、统计、计算增长率
③ [图表生成技能] → 生成销售趋势图、产品排名图
④ [文档技能] → 生成 Word/PDF 格式报告
⑤ [QQ 邮箱连接器] → 起草邮件,附上 PDF 报告
⑥ [自动化工具] → 设为每天 9:00 定时执行
→ 一次配置,永久自动化。每天雷打不动。
这就是"协作能力"的终极体现:它不是孤立的一个工具,而是串联你所有工具和资源的枢纽。

图 1.8 协作能力:WorkBuddy 作为枢纽,连接所有外部工具和服务
六、四大能力如何协同工作?
这四大能力不是独立存在的,它们在工作中是协同运作的。
来看一个综合示例:
场景:你要准备明天的董事会汇报
你说:"帮我准备一份董事会汇报材料。"
┌─────────────────────────────────────────┐
│ 对话能力 → 理解你的需求,确认汇报主题 │
│ ↓ │
│ 记忆能力 → 调取上次董事会的纪要 │
│ → 了解汇报的格式要求 │
│ ↓ │
│ 执行能力 → 拉取本月经营数据 │
│ → 分析同比增长/环比增长 │
│ → 生成 PPT 草稿 │
│ ↓ │
│ 协作能力 → 从数据库获取最新财务数据 │
│ → 调用腾讯文档共享协作 │
│ → 自动发给 CEO 预审 │
└─────────────────────────────────────────┘
结果:一份结构完整、数据准确、格式规范的董事会汇报 PPT
+ 配套的文字讲稿 + 数据附件
全部就绪,等待你的最终确认。
这就是一个完整"AI 同事"的样子:听得懂、干得好、记得牢、能联动。
七、小结
今天我们详细介绍了 WorkBuddy 的四大核心能力:
| 能力 | 核心要点 |
|---|---|
| 对话能力 | 自然语言理解 + 多轮对话 + 多种输入方式 |
| 执行能力 | 代码执行 + 文件操作 + API 调用 + 多步骤编排 |
| 记忆能力 | 对话记忆 + 偏好记忆 + 项目上下文 |
| 协作能力 | 连接器 + 技能 + 跨平台任务编排 |
有了这四种能力,WorkBuddy 不再是一个"聊天工具",而是一个真正能帮你干活的同事。
八、下一章预告
了解了"能做什么"之后,下一章我们会深入**“是怎么做到的”**。
👉 1.3 产品架构概述——揭开 WorkBuddy 的技术面纱,了解它的客户端-服务端架构、模型层、技能层、连接器层,以及数据存储与安全机制。
《唤醒你的 AI 同事》系列连载中,欢迎关注不迷路!
上一篇文章:1.1 产品定位与核心价值
系列导航:0. 介绍及目录
1177

被折叠的 条评论
为什么被折叠?



