qwen2.5-3B-instarl微调

原创已于 2025-10-11 14:12:01 修改 · 457 阅读

8 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

于 2025-09-01 16:34:52 首次发布

开发板推荐：天空星STM32F407VET6开发板

超高性价比 STM32主控 | 超高主频 | 一板兼容百芯 | 比赛神器 | 沉金彩色丝印

点击查看

全参数微调

阿里云人工智能平台API/交互式建模DSW

1.微调准备（网页UI安装）

1.1安装modelscope

要求PyTorch 版本 ≥ 2.6.0

pip install modelscope

pip install addict

1.2下载安装ollama

modelscope download --model gfunsAi/ollama-linux --local_dir ./ollama-linux --revision v0.6.0

cd ollama-linux && sudo chmod 777 ./ollama-modelscope-install.sh && ./ollama-modelscope-install.sh

1.3下载安装LLaMA-Factory

git clone https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

pip install -e .[metrics]

验证安装是否成功：

llamafactory-cil version

1.4下载qwen2.5-3B-Instruct

from modelscope.hub.snapshot_download import snapshot_download

model_id = "Qwen/Qwen2.5-3B-Instruct"
local_dir = "./models/Qwen/Qwen2.5-3B-Instruct"

# 下载模型
model_dir = snapshot_download(model_id, local_dir=local_dir)
print(f"Model downloaded to: {model_dir}")

ollama-linux/LLaMA-Factory/cache

cd ollama-linux/LLaMA-Factory/

pip install --upgrade “transformers>=4.45.0”

在这里插入图片描述