大模型（3）--提示学习

原创已于 2025-04-17 12:00:36 修改 · 517 阅读

·

4

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

于 2025-04-15 02:37:11 首次发布

一.提示学习

提示模型（Prompt Model）是指导大语言模型（LLM）生成特定输出的结构化输入方法，通常由自然语言指令、上下文和示例组成

特点

不改变模型内容
对输入进行工程化设置

核心要素

指令 - 明确任务要求（如"总结以下文本"）
上下文 - 提供相关背景信息
输入数据 - 需要处理的实际内容
输出指示 - 指定格式或限制条件

上下文学习中的三种模式

Zero-shot Learning
直接给出任务指令，不提供示例
依赖模型预训练知识
例：“将以下句子翻译成法语：”
Few-shot Learning
提供少量示例（通常3-5个）演示输入-输出对
通过类比推理生成答案
例：“苹果→apple；香蕉→banana；橘子→？”
Chain-of-Thought (CoT)
要求模型展示推理步骤
通过分步解释提升复杂任务表现
例：“解方程2x + 3 = 7：首先…”

二.思维链（Chain Of Thought）

让大语言模型（LLM）显式生成中间推理步骤的提示技术，通过模拟人类逐步解题的过程提升复杂任务的表现

特点

提升复杂任务性能
显著增强大模型在数学推理、逻辑推导、多跳问答等复杂任务中的准确性。
增强可解释性
显式的推理步骤使模型输出更透明，便于人类理解和验证。
减少“直觉性错误”
通过分步拆解问题，避免模型直接猜测答案导致的逻辑跳跃错误。

三.多路径推理

让大模型针对同一问题生成多条独立推理路径（即不同解题思路），最终通过一致性投票（如多数表决）或置信度筛选最优答案的技术。

核心特点

并行生成多条推理链
对同一问题，模型输出多个可能的解题过程（如不同计算步骤、逻辑路径）。
例：解方程时生成两种不同的代数变形路径。
结果一致性验证
Self-Consistency（自洽性）：选择被最多路径支持的答案（投票机制）；
置信度加权：根据模型对各路径的置信度评分综合判断。
降低随机性误差
通过多路径交叉验证，减少单次推理的偶然错误（如计算失误、逻辑遗漏）。

标签

#学习 #人工智能

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。