2025_NIPS_Bilevel ZOFO: Efficient LLM Fine-Tuning and Meta-Training

文章核心总结与创新点

主要内容

本文针对大语言模型(LLMs)微调的计算挑战,提出了双级优化框架Bilevel-ZOFO。该框架结合零阶优化(ZO)和参数高效微调(PEFT)的优势,内层通过一阶PEFT实现快速局部适配,降低ZO梯度估计方差并稳定训练;外层通过ZO更新整个模型骨干,提升泛化能力。实验验证了该方法在分类、问答等多类任务中,相较于MeZO(ZO方法)和传统FO-PEFT,实现2-4倍训练加速,同时保持相似内存效率,且在元学习场景中表现优异。

创新点

  1. 提出双级优化架构,首次将FO-PEFT与ZO全模型微调有机融合,互补解决各自缺陷(PEFT泛化不足、ZO收敛慢且对提示敏感)。
  2. 理论层面提供收敛保证,证明方法在合理假设下以O(ε⁻²)速率收敛,且复杂度与模型参数维度解耦。
  3. 兼顾内存效率与性能,在保持PEFT级内存消耗的同时,实现接近全模型微调的效果,支持大规模LLM扩展。
  4. 具备高效元学习能力,通过“ZO骨干更新+少量PEFT适配”的设计,实现少样本快速迁移,优于MetaICL等基线方法。

英文原文翻译(Markdown格式)

Abstract

使用一阶(FO)优化器对预训练大语言模型(LLMs)进行下游任务微调面临显著的计算挑战。参数高效微调(PEFT)方法通过冻结大部分模型参数、仅训练一小部分参数来应对这些挑战。然而,当需要高任务特定精度时,PEF

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值