一.提示学习
提示模型(Prompt Model)是指导大语言模型(LLM)生成特定输出的结构化输入方法,通常由自然语言指令、上下文和示例组成
特点
- 不改变模型内容
- 对输入进行工程化设置
核心要素
- 指令 - 明确任务要求(如"总结以下文本")
- 上下文 - 提供相关背景信息
- 输入数据 - 需要处理的实际内容
- 输出指示 - 指定格式或限制条件
上下文学习中的三种模式
- Zero-shot Learning
直接给出任务指令,不提供示例
依赖模型预训练知识
例:“将以下句子翻译成法语:” - Few-shot Learning
提供少量示例(通常3-5个)演示输入-输出对
通过类比推理生成答案
例:“苹果→apple;香蕉→banana;橘子→?” - Chain-of-Thought (CoT)
要求模型展示推理步骤
通过分步解释提升复杂任务表现
例:“解方程2x + 3 = 7:首先…”
二.思维链(Chain Of Thought)
让大语言模型(LLM)显式生成中间推理步骤的提示技术,通过模拟人类逐步解题的过程提升复杂任务的表现
特点
- 提升复杂任务性能
显著增强大模型在数学推理、逻辑推导、多跳问答等复杂任务中的准确性。 - 增强可解释性
显式的推理步骤使模型输出更透明,便于人类理解和验证。 - 减少“直觉性错误”
通过分步拆解问题,避免模型直接猜测答案导致的逻辑跳跃错误。
三.多路径推理
让大模型针对同一问题生成多条独立推理路径(即不同解题思路),最终通过一致性投票(如多数表决)或置信度筛选最优答案的技术。
核心特点
- 并行生成多条推理链
对同一问题,模型输出多个可能的解题过程(如不同计算步骤、逻辑路径)。
例:解方程时生成两种不同的代数变形路径。 - 结果一致性验证
Self-Consistency(自洽性):选择被最多路径支持的答案(投票机制);
置信度加权:根据模型对各路径的置信度评分综合判断。 - 降低随机性误差
通过多路径交叉验证,减少单次推理的偶然错误(如计算失误、逻辑遗漏)。
2万+

被折叠的 条评论
为什么被折叠?



