qwen2.5-3B-instarl微调

开发板推荐:天空星STM32F407VET6开发板

超高性价比 STM32主控 | 超高主频 | 一板兼容百芯 | 比赛神器 | 沉金彩色丝印

全参数微调

阿里云人工智能平台API/交互式建模DSW

1.微调准备(网页UI安装)

1.1安装modelscope

要求PyTorch 版本 ≥ 2.6.0

pip install modelscope

pip install addict

1.2下载安装ollama

modelscope download --model gfunsAi/ollama-linux --local_dir ./ollama-linux --revision v0.6.0

cd ollama-linux && sudo chmod 777 ./ollama-modelscope-install.sh && ./ollama-modelscope-install.sh

1.3下载安装LLaMA-Factory

git clone https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

pip install -e .[metrics]

验证安装是否成功:

llamafactory-cil version

1.4下载qwen2.5-3B-Instruct

from modelscope.hub.snapshot_download import snapshot_download

model_id = "Qwen/Qwen2.5-3B-Instruct"
local_dir = "./models/Qwen/Qwen2.5-3B-Instruct"

# 下载模型
model_dir = snapshot_download(model_id, local_dir=local_dir)
print(f"Model downloaded to: {model_dir}")

ollama-linux/LLaMA-Factory/cache

cd ollama-linux/LLaMA-Factory/

pip install --upgrade “transformers>=4.45.0”

在这里插入图片描述

DISABLE_VERSION_CHECK=1 llamafactory-cli webui --torch_dtype bfloat16

将.json文件送入到data文件夹中

在这里插入图片描述
聊天

训练

修改ollama-linux/LLaMA-Factory/data/dataset_info.json中为自己数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
saves/Qwen2.5-3B-Instruct/lora/train_2025-09-11-17-06-25

训练后预测
在这里插入图片描述
将检查点位置改为checkpoint位置

删除文件夹:

rm -r 文件夹名称

在这里插入图片描述

开发板推荐:天空星STM32F407VET6开发板

超高性价比 STM32主控 | 超高主频 | 一板兼容百芯 | 比赛神器 | 沉金彩色丝印

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

brain1234

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值