VLLM本机部署

原创已于 2025-05-01 12:44:23 修改 · 509 阅读

本内容遵循CC 4.0 BY-SA版权协议

收录于

当前文章被以下社区和专栏收录：

于 2025-04-26 17:07:10 首次发布

VLLM本机部署——附代码

GPU:3070

创建镜像： bash deploy/build_docker.sh

下载模型权重资源
自行在huggingface下载对应权重，由于3070显存8G较小，选择1.5B以下模型
通过docker -v 挂载
docker run -it -v your_ckpt_path:/workspace/Qwen2.5-0.5B-Instruct /bin/bash
启动vllm服务
进入docker容器里后，运行bash deploy/start_service.sh

重启后， docker images失效，无法运行
原因是docker找不到data_root，临时解决方案是：1.修改/etc/docker/daemon.jon为错误格式，运行systemctl restart docker, 报错；2. 第一步修改为正确格式，再重启docker
2）由于配置代理，无法联网
dockerfile中已经重置了http_proxy: “ARG http_proxy”

标签