收藏！小白程序员必看：Prompt、Skill、Tool、Plugin、MCP、Agent架构分层详解，轻松入门大模型

最新推荐文章于 2026-06-18 14:16:48 发布

原创最新推荐文章于 2026-06-18 14:16:48 发布 · 241 阅读

5 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #学习 #产品经理 #转行 #ai

Prompt, Skill, Tool, Plugin, MCP, Agent 架构分层对比

一、先回答一个问题：Skill和Prompt到底有什么区别？

第一篇讲了Skill是什么，这一篇回答一个更根本的问题：Skill和Prompt的边界到底在哪？

很多人有这个困惑：我在Dify里配的LLM组件，配一次就能反复跑，这和Skill有什么区别？

先说结论：放在流水线里的Prompt，依然是Prompt。Skill比它多了一层封装。

二、AI Agent 完整架构全景图

┌─────────────────────────────────────────────────────────┐
│                     用户请求                             │
└───────────────────────────┬─────────────────────────────┘
                            ▼
┌─────────────────────────────────────────────────────────┐
│                     Agent（大脑）                        │
│  ┌──────────┐  ┌──────────┐  ┌──────────┐  ┌──────────┐ │
│  │  目标理解 │  │  任务规划 │  │  反思纠错 │  │  记忆管理 │ │
│  └──────────┘  └──────────┘  └──────────┘  └──────────┘ │
└───────────────────────────┬─────────────────────────────┘
                            ▼
┌─────────────────────────────────────────────────────────┐
│              编排执行器（选工具、调度、重试）              │
└───┬───────────────┬───────────────┬──────────────────┬───┘
    ▼               ▼               ▼                  ▼
┌─────────┐   ┌────────────┐   ┌────────────┐    ┌────────────┐
│  Skill  │   │   Tool     │   │  Workflow  │    │   LLM      │
│ 原生能力│   │ 外部工具   │   │ 流程控制   │    │ 大模型     │
└────┬────┘   └──────┬─────┘   └────────────┘    └────────────┘
     ▼               ▼
┌─────────┐   ┌────────────┐
│ Prompt  │   │    MCP     │
│ 指令模板│   │ 工具连接协议│
└─────────┘   └──────┬─────┘
                     ▼
            ┌──────────────────┐
            │ 外部系统/服务/资源 │
            └──────────────────┘

这张图的三条主线：

Agent大脑：目标理解、任务规划、反思纠错、记忆管理
编排执行器：负责选工具、调度、重试，决定什么时候用什么能力
MCP协议层：AI与外部世界的USB-C接口，统一、安全、可复用

三、各层深度定义

1. Prompt：最底层的原子指令

你在对话框里写的每一句话，都是Prompt。

本质：发给LLM的自然语言上下文指令，单次引导模型行为。无状态、无逻辑、一次性。

你是专业翻译，将以下中文翻译成正式英文：
xxx

这段文字发出去，模型给你结果，这段Prompt的使命就结束了。下次再问，你要从头描述上下文。

放在Dify里会变吗？不会。你配的LLM组件里那段Prompt文本，依然是Prompt——只是被流水线固化了，但它依然是"对模型说什么"本身。

2. Skill：Prompt的结构化封装层

本质：可复用的LLM原生任务能力单元。

构成：固定Prompt模板 + 任务规则 + 输出格式。特点：不依赖外部工具、可命名、可路由、可复用。

一个真正的Skill有清晰的触发边界：什么情况进来、什么情况出去、输出什么格式。你不需要每次告诉它"你现在是一个文本摘要专家"，它自己知道。

典型Skill：文本摘要、情感分析、代码解释、文案润色。

这些能力纯靠LLM本身就能完成，不依赖外部工具。Skill的价值在于：定义一次，之后无数次调用。

3. Tool：外部真实执行单元

本质：可被调用的外部功能、函数或服务。

作用：完成LLM无法独立完成的真实世界操作——计算器算数学、搜索引擎查资料、数据库读写、代码执行器跑程序。

特点：可改变外部状态、有确定的输入输出、结果可验证。 你调用Tool，真实世界会发生变化。

Prompt和Skill本身不产生真实副作用，Tool会。

4. Plugin：Tool的标准化接口封装

本质：Tool + 接口描述 + 参数规范 + 权限配置。

作用：让Agent/LLM能够理解一个工具是干什么的、怎么调用、传入什么参数。

{"name":"calculator","description":"计算数学表达式","parameters":{"expression":"string"}}

Tool是功能本体，Plugin是功能的使用手册。

5. MCP：AI调用外部能力的标准化协议

MCP，全称Model Context Protocol，是一套标准化通信协议 + 接口层，专门解决一个问题：AI如何安全、统一地调用外部工具和服务？

它的真实定位：

Agent要调用外部能力 → 走MCP协议
Tool/Plugin要暴露给AI → 用MCP封装

类比USB-C接口：

电脑（Agent）不需要知道每个设备的驱动程序，走USB-C协议，鼠标、键盘、硬盘都能用
外部设备（Tool/Plugin）不需要为每台电脑写不同的驱动，暴露MCP接口，就能被所有支持MCP的AI系统调用
没有MCP：每个AI系统每个Tool都要单独写适配代码，换平台要重写。

有MCP：Tool一次封装，MCP协议通用。换平台不换接口。

6. Agent：顶层自主决策大脑

本质：具备目标驱动、规划、记忆、反思、调度能力的决策系统。

构成：

LLM大脑：理解用户意图
目标理解：拆解用户想要什么
任务规划：制定执行步骤
反思纠错：检查并修正错误
记忆管理：跨会话保持上下文

核心能力：

理解用户目标
拆解任务，制定执行计划
通过编排执行器调度Skill / Tool
多轮执行、纠错、重试
输出最终结果

Agent有状态，可自主决策，可处理复杂长流程任务——它不是在回答问题，而是在完成任务。

四、三条主线的依赖关系

Agent（大脑：目标、规划、反思）
  ↓
编排执行器（选工具、调度、重试）
  │
  ├── Skill ──→ Prompt（LLM原生能力，不依赖外部工具）
  │
  └── MCP Client ──→ MCP Server ──→ 外部系统/服务/资源
       │
       └── Plugin + Tool（外部真实执行）

关键逻辑：

Agent不直接调用Tool，通过编排执行器统一调度
Skill构建在Prompt之上，Plugin封装Tool的功能
MCP是AI和外部能力之间的USB-C——统一协议，两头通用

五、极简对比表

模块	本质	状态	依赖	工程化程度	核心价值
Prompt	文本指令	无	LLM	低	单次引导模型
Skill	封装任务能力	轻量	Prompt + LLM	中	可复用原生能力
Tool	外部功能	有	外部系统	中高	真实世界执行
Plugin	工具接口封装	无	Tool	高	让模型理解工具
MCP	标准化通信协议	有	Agent + Tool/Plugin	高	AI与外部能力的统一接口
Agent	自主智能体	有	LLM + 记忆 + 编排器	最高	目标驱动自主完成任务

六、一句话类比：餐厅系统

Prompt：一句具体的做菜指令，“这个鱼加点姜蒸”
Skill：厨师掌握的手艺，切、炒、炖，每样都是标准动作
Tool：锅、铲、烤箱、秤，真实操作的物理工具
Plugin：工具使用说明书，告诉你这个锅怎么开火
MCP：后厨标准化传菜通道，菜做完了走这个通道传出去
Agent：主厨，统筹点菜、排菜、流程、把控最终结果

七、回到最初的问题

Skill和Prompt的区别，现在可以给一个清晰答案了：

不在于"放在哪里"，在于"有没有独立身份"。

Dify流水线里的LLM组件，叫它Prompt没有问题——本质上还是"对模型说什么"。Skill的价值在于它有独立的边界定义：触发条件是什么、输出Schema是什么、能不能被其他Skill调用。

Skill是封装好的能力单元，可以被路由、被组合、被管理。Prompt是能力单元里的文本内容。

下次你设计AI系统，问自己这个问题：我是在写一段文本，还是在定义一个能力？ 前者是Prompt，后者才是Skill。

八、自检清单：你在哪一层？

检查项	你在做	正确姿势
每次都重新描述上下文	Prompt	Skill化，给固定模板
定义的是"模型说什么"	Prompt	加上触发边界，变成Skill
涉及外部真实操作	Tool	Plugin封装 + MCP调度
需要协调多个能力	编排执行器	Agent层做规划调度
想让AI调用外部服务	Tool + MCP	一次封装，跨平台通用