大模型(3)--提示学习

一.提示学习

提示模型(Prompt Model)是指导大语言模型(LLM)生成特定输出的结构化输入方法,通常由自然语言指令、上下文和示例组成

特点

  • 不改变模型内容
  • 对输入进行工程化设置

核心要素

  • 指令 - 明确任务要求(如"总结以下文本")
  • 上下文 - 提供相关背景信息
  • 输入数据 - 需要处理的实际内容
  • 输出指示 - 指定格式或限制条件

上下文学习中的三种模式

  • Zero-shot Learning
    直接给出任务指令,不提供示例
    依赖模型预训练知识
    例:“将以下句子翻译成法语:”
  • Few-shot Learning
    提供少量示例(通常3-5个)演示输入-输出对
    通过类比推理生成答案
    例:“苹果→apple;香蕉→banana;橘子→?”
  • Chain-of-Thought (CoT)
    要求模型展示推理步骤
    通过分步解释提升复杂任务表现
    例:“解方程2x + 3 = 7:首先…”

二.思维链(Chain Of Thought)

让大语言模型(LLM)显式生成中间推理步骤的提示技术,通过模拟人类逐步解题的过程提升复杂任务的表现

特点

  • 提升复杂任务性能
    显著增强大模型在数学推理、逻辑推导、多跳问答等复杂任务中的准确性。
  • 增强可解释性
    显式的推理步骤使模型输出更透明,便于人类理解和验证。
  • 减少“直觉性错误”
    通过分步拆解问题,避免模型直接猜测答案导致的逻辑跳跃错误。

三.多路径推理

让大模型针对同一问题生成多条独立推理路径(即不同解题思路),最终通过一致性投票(如多数表决)或置信度筛选最优答案的技术。

核心特点

  • 并行生成多条推理链
    对同一问题,模型输出多个可能的解题过程(如不同计算步骤、逻辑路径)。
    例:解方程时生成两种不同的代数变形路径。
  • 结果一致性验证
    Self-Consistency(自洽性):选择被最多路径支持的答案(投票机制);
    置信度加权:根据模型对各路径的置信度评分综合判断。
  • 降低随机性误差
    通过多路径交叉验证,减少单次推理的偶然错误(如计算失误、逻辑遗漏)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值