《唤醒你的AI同事:WorkBuddy从零上手》002:核心能力一览

1.2 核心能力一览——WorkBuddy 到底能帮你做什么?

本文是《唤醒你的 AI 同事——WorkBuddy 从零上手》系列第二篇


📖 上一节回顾:WorkBuddy 是什么?

在上篇文章「1.1 产品定位与核心价值」中,我们把 WorkBuddy 定义为一位**“AI 同事”**——不是只会聊天的机器人,而是真正能帮你干活的伙伴。我们讨论了它的核心价值:降本增效、知识沉淀、流程自动化。

但你可能会有一个疑问:它到底是怎么做到这些的?它的本事从何而来?

这就是本节我们要回答的问题。本节我们将逐一拆解 WorkBuddy 的四大核心能力:对话、执行、记忆、协作。


1.2 核心能力一览


一、四大核心能力总览

WorkBuddy 就像一个真正的职场老员工,具备四项基本素质:

能力一句话总结类比真人
对话能力听得懂人话,能进行多轮对话能沟通
执行能力能动手做事,不只是嘴上说说能干活
记忆能力记住你的偏好和上下文有经验
协作能力能连接外部工具,搞定复杂事有资源

在这里插入图片描述

图 1.4 WorkBuddy 的四大核心能力:对话、执行、记忆、协作

这四个能力层层递进,构成了 WorkBuddy 作为一个完整"AI 同事"的能力体系。下面我们来逐一深入了解。


二、对话能力:理解自然语言,进行多轮对话

对话能力是 WorkBuddy 最基础的能力。它让你能用自然语言——就像跟真人说话一样——下达任务,而不需要学习任何编程语言或命令格式。

2.1 什么叫"听懂人话"

想象一下,你的新同事小王来了第一天,你跟他说:“帮我把这份合同的风险条款标出来。”

小王能听懂吗?当然能。因为他理解自然语言。

WorkBuddy 也一样。

你说:"帮我整理这份合同的风险条款,用红色标注,写一份摘要发给王经理。"

WorkBuddy 理解了三件事:
  1. 读取合同文件 → 执行操作
  2. 识别风险条款 → 红色高亮
  3. 写摘要发邮件 → 发送给王经理

这不是简单的关键词匹配,而是真正理解你的意图,并把它拆解成可执行的步骤。

2.2 多轮对话:从"一问一答"到"连续协作"

WorkBuddy 不只是"我问一句,它答一句"。它能理解上下文,和你进行连贯的多轮对话。

第一轮: "帮我分析一下上个季度的销售数据。"
        → WorkBuddy 拉取数据,生成分析报告

第二轮: "好的,哪个产品贡献最大?"
        → "贡献最大的是旗舰产品线,占比34.2%。"

第三轮: "跟去年同期比呢?"
        → "同比增长12.8%,主要是新品类的拉动。"

第四轮: "把这张对比图表导出为 PNG。"
        → "已完成,保存在桌面。"

注意:你没有在任何一轮对话中重新说明"上季度"是哪个季度、"这个产品"指的是什么。WorkBuddy 记住了上下文,让对话保持了连贯性。

2.3 支持的输入方式

WorkBuddy 不止接受纯文本输入,还支持多种方式:

输入方式说明典型场景
纯文本输入直接输入自然语言绝大部分任务
Markdown 文本支持格式化(标题、代码块、列表)结构化任务描述
文件上传上传文档、表格、PDF 等需要 WorkBuddy 分析的内容
图片上传截图、照片、扫描件图片内容识别与分析
语音输入语音转文字不方便打字时(如通勤路上)

多种输入方式的组合使用让沟通更加灵活:

组合场景示例:
  Step 1 → 上传一张手机截图(合同条款)
  Step 2 → 输入文字:"识别图片中的风险条款"
  Step 3 → 再上传一个 Excel 文件:"对比这个文件的数据"
  Step 4 → "综合以上两份材料,写一份评估报告"

在这里插入图片描述

图 1.5 对话能力:从需求描述到多轮追问,一气呵成


三、执行能力:不只是说,而是做

如果说对话能力是 WorkBuddy 的"嘴",那执行能力就是它的"手"。

这是 WorkBuddy 与所有其他聊天机器人最大的区别。

3.1 代码执行:写代码、跑代码、交结果

WorkBuddy 可以自动生成并执行代码,完成各种数据处理、文件转换、自动化任务。

举个例子:你说一句话,WorkBuddy 帮你画图。

你说:"帮我用这段数据画一个折线图,展示每月的增长趋势。"

WorkBuddy 自动完成:
  1. 理解你的需求
  2. 自动生成 Python 代码
  3. 执行代码
  4. 把图表 PNG 文件交给你

你不需要懂 Python,不需要知道怎么安装 matplotlib 库,不需要处理各种报错。WorkBuddy 帮你写、帮你跑、直接把图表交给你

3.2 文件操作:直接操作本地文件

WorkBuddy 可以直接操作你授权范围内的本地文件,完成各种批量处理任务:

操作类型示例
批量重命名“把所有照片按拍摄日期重命名”
格式转换“把这100个 TXT 文件转换成 PDF”
内容提取“从文件夹里所有 Word 文档中提取表格”
文件整理“按文件类型和日期分类整理这个文件夹”
内容合并“把这20个 Excel 表格合并成一个”

3.3 API 调用:连接外部服务

WorkBuddy 可以连接外部服务,调用 API 完成任务:

  • 创建腾讯文档并写入内容
  • 发送邮件到指定收件人
  • 查询数据库并生成报告
  • 更新项目管理工具中的任务状态

3.4 多步骤任务编排:自主规划,全自动执行

WorkBuddy 最强大的地方在于它能自主规划多步骤任务

你的请求:
"整理这个项目文件夹里所有的文档,
 把 Word 转换成 PDF,提取每个文档的标题和摘要,
 做成一份目录索引。"

WorkBuddy 的自动规划与执行:

  Step 1 → 扫描指定文件夹中的所有文件
  Step 2 → 筛选出 Word 文档(.doc/.docx)
  Step 3 → 逐个读取每个 Word 文档
  Step 4 → 提取标题(第一个标题)和摘要(前300字)
  Step 5 → 将每个 Word 文档转换为 PDF
  Step 6 → 生成 Markdown 格式的目录索引文件
  Step 7 → 输出两个结果:
           → PDF 文件夹(所有转换后的 PDF)
           → 目录索引.md(所有文档的标题和摘要)

这就是"执行能力"的含义:不是给你一个建议,而是把整件事做完。

在这里插入图片描述

图 1.6 执行能力:从一句话到多步自动执行,最终交付成果


四、记忆能力:记住你的偏好和项目上下文

4.1 对话记忆:越聊越懂你

WorkBuddy 会记住你们之间的对话历史,这样在后续对话中就不需要重复背景信息。

周一 上午: "我正在做一个关于航空应急救援的项目,
              主要研究直升机在山地救援中的应用。"

周四 下午: "帮我在上周写的文档基础上,再补充一个章节,
              写山地救援直升机的选型标准。"

→ WorkBuddy 知道:
  - "上周写的文档"是指航空应急救援项目
  - "这个章节"要写直升机选型标准
  - 不需要你重新解释项目背景

4.2 偏好记忆:了解你的工作风格

WorkBuddy 会逐渐记住你的个人偏好

记忆内容举例
写作风格你喜欢正式的公文语气,还是轻松的口语化风格?
格式要求报告要不要摘要?标题用几级?要不要加目录?
图表偏好你喜欢柱状图还是折线图?用什么配色?
术语习惯你们公司内部叫什么?(如"OKR"叫"目标与关键结果"还是直接用缩写)

4.3 项目记忆:完整的项目上下文

对于复杂项目,WorkBuddy 可以保存项目级上下文

项目:航空应急救援分会峰会筹备(6月27日)

记住的关键信息:
  ✓ 峰会日期和地点
  ✓ 课题编号:4、7、11
  ✓ 每个课题的展示重点和目标受众
  ✓ 相关文件和素材的位置
  ✓ 之前的决策和修改记录
  ✓ 对接人和联系方式

当你说"那个峰会的视频",WorkBuddy 自动知道
你指的是哪个项目、哪份文件、哪个时间节点。

在这里插入图片描述

图 1.7 记忆能力:从个人偏好到项目上下文,越来越懂你的 WorkBuddy


五、协作能力:连接外部工具,执行复杂任务

5.1 连接器(Connector):连接你日常用的所有服务

通过连接器,WorkBuddy 可以连接你日常工作用到的各种平台和服务:

连接器能力典型场景
腾讯文档创建、编辑、分享在线文档生成会议纪要、共享文档
QQ 邮箱收发邮件、管理联系人自动发送报告、邮件分类
数据库查询/写入数据数据导出、报表生成
Git版本控制操作代码审查、提交记录分析
云盘文件上传/下载/分享批量文件整理和分发
项目管理工具TAPD、Jira 等任务状态同步、进度追踪

5.2 技能(Skill):你的数字工具箱

技能是 WorkBuddy 的"工具箱",每个技能提供一项专门的能力:

技能类别代表技能适用人群
文档处理PDF 提取、Word 生成、PPT 创建、Excel 分析所有办公人员
开发辅助代码审查、Bug 定位、API 文档生成程序员、测试人员
内容创作博客文章生成、SEO 优化、多语言翻译运营、市场、写作者
数据分析数据清洗、可视化、统计检验数据分析师、研究员
多媒体AI 图片生成、视频生成设计师、创作者

5.3 协同执行:打通全流程的复杂任务

WorkBuddy 最让人惊喜的能力,是将多个技能和连接器组合起来,执行跨平台、多步骤的复杂任务:

你的请求:
"每天早上9点,自动做这几件事:
 1. 从数据库拉取昨天的销售数据
 2. 分析关键指标并生成图表
 3. 生成一份 PDF 日报
 4. 通过邮件发给管理层
 5. 发到团队微信群"

WorkBuddy 的执行流程:

  ① [数据库连接器] → 查询昨日销售数据
  ② [数据分析技能] → 清洗、统计、计算增长率
  ③ [图表生成技能] → 生成销售趋势图、产品排名图
  ④ [文档技能] → 生成 Word/PDF 格式报告
  ⑤ [QQ 邮箱连接器] → 起草邮件,附上 PDF 报告
  ⑥ [自动化工具] → 设为每天 9:00 定时执行

→ 一次配置,永久自动化。每天雷打不动。

这就是"协作能力"的终极体现:它不是孤立的一个工具,而是串联你所有工具和资源的枢纽。

在这里插入图片描述

图 1.8 协作能力:WorkBuddy 作为枢纽,连接所有外部工具和服务


六、四大能力如何协同工作?

这四大能力不是独立存在的,它们在工作中是协同运作的。

来看一个综合示例:

场景:你要准备明天的董事会汇报

  你说:"帮我准备一份董事会汇报材料。"

  ┌─────────────────────────────────────────┐
  │  对话能力  →  理解你的需求,确认汇报主题  │
  │     ↓                                     │
  │  记忆能力  →  调取上次董事会的纪要       │
  │           →  了解汇报的格式要求           │
  │     ↓                                     │
  │  执行能力  →  拉取本月经营数据            │
  │           →  分析同比增长/环比增长        │
  │           →  生成 PPT 草稿               │
  │     ↓                                     │
  │  协作能力  →  从数据库获取最新财务数据    │
  │           →  调用腾讯文档共享协作         │
  │           →  自动发给 CEO 预审            │
  └─────────────────────────────────────────┘

  结果:一份结构完整、数据准确、格式规范的董事会汇报 PPT
       + 配套的文字讲稿 + 数据附件
       全部就绪,等待你的最终确认。

这就是一个完整"AI 同事"的样子:听得懂、干得好、记得牢、能联动。


七、小结

今天我们详细介绍了 WorkBuddy 的四大核心能力:

能力核心要点
对话能力自然语言理解 + 多轮对话 + 多种输入方式
执行能力代码执行 + 文件操作 + API 调用 + 多步骤编排
记忆能力对话记忆 + 偏好记忆 + 项目上下文
协作能力连接器 + 技能 + 跨平台任务编排

有了这四种能力,WorkBuddy 不再是一个"聊天工具",而是一个真正能帮你干活的同事


八、下一章预告

了解了"能做什么"之后,下一章我们会深入**“是怎么做到的”**。

👉 1.3 产品架构概述——揭开 WorkBuddy 的技术面纱,了解它的客户端-服务端架构、模型层、技能层、连接器层,以及数据存储与安全机制。


《唤醒你的 AI 同事》系列连载中,欢迎关注不迷路!
上一篇文章:1.1 产品定位与核心价值
系列导航:0. 介绍及目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

翰墨之道

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值