Prompt, Skill, Tool, Plugin, MCP, Agent 架构分层对比
一、先回答一个问题:Skill和Prompt到底有什么区别?
第一篇讲了Skill是什么,这一篇回答一个更根本的问题:Skill和Prompt的边界到底在哪?
很多人有这个困惑:我在Dify里配的LLM组件,配一次就能反复跑,这和Skill有什么区别?
先说结论:放在流水线里的Prompt,依然是Prompt。Skill比它多了一层封装。
二、AI Agent 完整架构全景图
┌─────────────────────────────────────────────────────────┐
│ 用户请求 │
└───────────────────────────┬─────────────────────────────┘
▼
┌─────────────────────────────────────────────────────────┐
│ Agent(大脑) │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 目标理解 │ │ 任务规划 │ │ 反思纠错 │ │ 记忆管理 │ │
│ └──────────┘ └──────────┘ └──────────┘ └──────────┘ │
└───────────────────────────┬─────────────────────────────┘
▼
┌─────────────────────────────────────────────────────────┐
│ 编排执行器(选工具、调度、重试) │
└───┬───────────────┬───────────────┬──────────────────┬───┘
▼ ▼ ▼ ▼
┌─────────┐ ┌────────────┐ ┌────────────┐ ┌────────────┐
│ Skill │ │ Tool │ │ Workflow │ │ LLM │
│ 原生能力│ │ 外部工具 │ │ 流程控制 │ │ 大模型 │
└────┬────┘ └──────┬─────┘ └────────────┘ └────────────┘
▼ ▼
┌─────────┐ ┌────────────┐
│ Prompt │ │ MCP │
│ 指令模板│ │ 工具连接协议│
└─────────┘ └──────┬─────┘
▼
┌──────────────────┐
│ 外部系统/服务/资源 │
└──────────────────┘
这张图的三条主线:
- Agent大脑:目标理解、任务规划、反思纠错、记忆管理
- 编排执行器:负责选工具、调度、重试,决定什么时候用什么能力
- MCP协议层:AI与外部世界的USB-C接口,统一、安全、可复用
三、各层深度定义
1. Prompt:最底层的原子指令
你在对话框里写的每一句话,都是Prompt。
本质:发给LLM的自然语言上下文指令,单次引导模型行为。无状态、无逻辑、一次性。
你是专业翻译,将以下中文翻译成正式英文:
xxx
这段文字发出去,模型给你结果,这段Prompt的使命就结束了。下次再问,你要从头描述上下文。
放在Dify里会变吗?不会。你配的LLM组件里那段Prompt文本,依然是Prompt——只是被流水线固化了,但它依然是"对模型说什么"本身。
2. Skill:Prompt的结构化封装层
本质:可复用的LLM原生任务能力单元。
构成:固定Prompt模板 + 任务规则 + 输出格式。特点:不依赖外部工具、可命名、可路由、可复用。
一个真正的Skill有清晰的触发边界:什么情况进来、什么情况出去、输出什么格式。你不需要每次告诉它"你现在是一个文本摘要专家",它自己知道。
典型Skill:文本摘要、情感分析、代码解释、文案润色。
这些能力纯靠LLM本身就能完成,不依赖外部工具。Skill的价值在于:定义一次,之后无数次调用。
3. Tool:外部真实执行单元
本质:可被调用的外部功能、函数或服务。
作用:完成LLM无法独立完成的真实世界操作——计算器算数学、搜索引擎查资料、数据库读写、代码执行器跑程序。
特点:可改变外部状态、有确定的输入输出、结果可验证。 你调用Tool,真实世界会发生变化。
Prompt和Skill本身不产生真实副作用,Tool会。
4. Plugin:Tool的标准化接口封装
本质:Tool + 接口描述 + 参数规范 + 权限配置。
作用:让Agent/LLM能够理解一个工具是干什么的、怎么调用、传入什么参数。
{"name":"calculator","description":"计算数学表达式","parameters":{"expression":"string"}}
Tool是功能本体,Plugin是功能的使用手册。
5. MCP:AI调用外部能力的标准化协议
MCP,全称Model Context Protocol,是一套标准化通信协议 + 接口层,专门解决一个问题:AI如何安全、统一地调用外部工具和服务?
它的真实定位:
Agent要调用外部能力 → 走MCP协议
Tool/Plugin要暴露给AI → 用MCP封装
类比USB-C接口:
- 电脑(Agent)不需要知道每个设备的驱动程序,走USB-C协议,鼠标、键盘、硬盘都能用
- 外部设备(Tool/Plugin)不需要为每台电脑写不同的驱动,暴露MCP接口,就能被所有支持MCP的AI系统调用
- 没有MCP:每个AI系统每个Tool都要单独写适配代码,换平台要重写。
有MCP:Tool一次封装,MCP协议通用。换平台不换接口。
6. Agent:顶层自主决策大脑
本质:具备目标驱动、规划、记忆、反思、调度能力的决策系统。
构成:
- LLM大脑:理解用户意图
- 目标理解:拆解用户想要什么
- 任务规划:制定执行步骤
- 反思纠错:检查并修正错误
- 记忆管理:跨会话保持上下文
核心能力:
- 理解用户目标
- 拆解任务,制定执行计划
- 通过编排执行器调度Skill / Tool
- 多轮执行、纠错、重试
- 输出最终结果
Agent有状态,可自主决策,可处理复杂长流程任务——它不是在回答问题,而是在完成任务。
四、三条主线的依赖关系
Agent(大脑:目标、规划、反思)
↓
编排执行器(选工具、调度、重试)
│
├── Skill ──→ Prompt(LLM原生能力,不依赖外部工具)
│
└── MCP Client ──→ MCP Server ──→ 外部系统/服务/资源
│
└── Plugin + Tool(外部真实执行)
关键逻辑:
- Agent不直接调用Tool,通过编排执行器统一调度
- Skill构建在Prompt之上,Plugin封装Tool的功能
- MCP是AI和外部能力之间的USB-C——统一协议,两头通用
五、极简对比表
| 模块 | 本质 | 状态 | 依赖 | 工程化程度 | 核心价值 |
|---|---|---|---|---|---|
| Prompt | 文本指令 | 无 | LLM | 低 | 单次引导模型 |
| Skill | 封装任务能力 | 轻量 | Prompt + LLM | 中 | 可复用原生能力 |
| Tool | 外部功能 | 有 | 外部系统 | 中高 | 真实世界执行 |
| Plugin | 工具接口封装 | 无 | Tool | 高 | 让模型理解工具 |
| MCP | 标准化通信协议 | 有 | Agent + Tool/Plugin | 高 | AI与外部能力的统一接口 |
| Agent | 自主智能体 | 有 | LLM + 记忆 + 编排器 | 最高 | 目标驱动自主完成任务 |
六、一句话类比:餐厅系统
- Prompt:一句具体的做菜指令,“这个鱼加点姜蒸”
- Skill:厨师掌握的手艺,切、炒、炖,每样都是标准动作
- Tool:锅、铲、烤箱、秤,真实操作的物理工具
- Plugin:工具使用说明书,告诉你这个锅怎么开火
- MCP:后厨标准化传菜通道,菜做完了走这个通道传出去
- Agent:主厨,统筹点菜、排菜、流程、把控最终结果
七、回到最初的问题
Skill和Prompt的区别,现在可以给一个清晰答案了:
不在于"放在哪里",在于"有没有独立身份"。
Dify流水线里的LLM组件,叫它Prompt没有问题——本质上还是"对模型说什么"。Skill的价值在于它有独立的边界定义:触发条件是什么、输出Schema是什么、能不能被其他Skill调用。
Skill是封装好的能力单元,可以被路由、被组合、被管理。Prompt是能力单元里的文本内容。
下次你设计AI系统,问自己这个问题:我是在写一段文本,还是在定义一个能力? 前者是Prompt,后者才是Skill。
八、自检清单:你在哪一层?
| 检查项 | 你在做 | 正确姿势 |
|---|---|---|
| 每次都重新描述上下文 | Prompt | Skill化,给固定模板 |
| 定义的是"模型说什么" | Prompt | 加上触发边界,变成Skill |
| 涉及外部真实操作 | Tool | Plugin封装 + MCP调度 |
| 需要协调多个能力 | 编排执行器 | Agent层做规划调度 |
| 想让AI调用外部服务 | Tool + MCP | 一次封装,跨平台通用 |
普通人如何抓住AI大模型的风口?
领取方式在文末
为什么要学习大模型?
目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。
目前,开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景,其中,应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过 30%。

随着AI大模型技术的迅速发展,相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业:

人工智能大潮已来,不加入就可能被淘汰。如果你是技术人,尤其是互联网从业者,现在就开始学习AI大模型技术,真的是给你的人生一个重要建议!
最后
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!
在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

大模型全套学习资料展示
自我们与MoPaaS魔泊云合作以来,我们不断打磨课程体系与技术内容,在细节上精益求精,同时在技术层面也新增了许多前沿且实用的内容,力求为大家带来更系统、更实战、更落地的大模型学习体验。

希望这份系统、实用的大模型学习路径,能够帮助你从零入门,进阶到实战,真正掌握AI时代的核心技能!
01 教学内容

-
从零到精通完整闭环:【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块,内容比传统教材更贴近企业实战!
-
大量真实项目案例: 带你亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!
02适学人群
应届毕业生: 无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型: 非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能突破瓶颈: 传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。

vx扫描下方二维码即可
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!
03 入门到进阶学习路线图
大模型学习路线图,整体分为5个大的阶段:

04 视频和书籍PDF合集

从0到掌握主流大模型技术视频教程(涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向)

新手必备的大模型学习PDF书单来了!全是硬核知识,帮你少走弯路(不吹牛,真有用)

05 行业报告+白皮书合集
收集70+报告与白皮书,了解行业最新动态!

06 90+份面试题/经验
AI大模型岗位面试经验总结(谁学技术不是为了赚$呢,找个好的岗位很重要)

07 deepseek部署包+技巧大全

由于篇幅有限
只展示部分资料
并且还在持续更新中…
真诚无偿分享!!!
vx扫描下方二维码即可
加上后会一个个给大家发
【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】

199

被折叠的 条评论
为什么被折叠?



