AI Agent学习 -- 概念篇
AI Agent是一个能围绕目标反复推理、调用工具、读取上下文、根据结果继续行动的系统。可以先把 Agent 理解成一个“会反复思考并调用工具的循环”:模型先理解任务,需要外部信息时调用工具或读取记忆,关键步骤经过检查点,最后再输出结果。后面所有复杂框架,本质上都是在这条基础循环上增加编排、权限和状态管理。
什么是AI Agent
一个最小可理解的 Agent,通常由四个部分组成:
目标:用户真正希望完成什么。
模型:理解目标、规划下一步、判断工具结果。
工具:搜索、读写文件、查数据库、调用外部 API。
反馈:工具返回结果、测试输出、人类确认、失败信息。
工作流程如下:
Goal -> Model -> Tool call -> Observation -> Model -> Next step -> Result
流程中最关键的不是“模型有多聪明”,而是反馈是否真实,是否能拿到真实环境中的反馈。
AI Agent与LLM的区别
| 能力 | 说明 |
|---|---|
| 工具调用 | 能够操作外部工具 |
| 任务规划 | 能将目标拆分成多个步骤并执行 |
| 记忆机制 | 保留任务过程以及用户的信息 |
| 自动执行 | 在关键步骤前需要用户确认,确认后可以自动执行 |
AI Agent的使用场景
1.开放式任务,没有固定答案的
2.需要使用外部工具,如数据库、外部网页等
3.能够提供沙箱、权限边界和人工确认的场景
4.结果能被验证,或者有真实反馈的
5.需要记忆上下文的任务
如客服Agent场景,因为既需要对话,又需要外部工具(如查询操作、转人工等需求),此外又有真实的反馈(评分及满意度调查);代码Agent场景,Agent能够按照目标将任务拆分成多个段,且结果可以被验证测试
AI Agent的使用技巧
1.需要有明确的目标,如果没有目标,Agent理解任务需求容易不明确
2.调用工具决定了Agent的能力边界和风险边界
3.需要有明确的反馈,来纠正Agent的尝试方向
4.只给 Agent 它实际需要的最小权限,Agent权限越大约危险
9078

被折叠的 条评论
为什么被折叠?



