应导师要求最近需要测试RAG vs. finetuning,好不容易找到可实践的模型,在搭建环境时就卡了我两天。
网上很多关于vLLM安装的教程,在我看来就分为两类:(1)按照vLLM官方说明Installation — vLLM安装在cuda12.1或cuda11.8下, pytorch官网(Previous PyTorch Versions | PyTorch)可以查找与本地cuda版本匹配的pytorch版本,;(2)通过修改vLLM的requirement文件来安装在其他cuda版本下。
因为我服务器是远程连接实验室多人共享的,不能重装cuda,所以尝试上面说的第二种方法,整整两天,终于第二天晚上弄好了。备注:不修改requirement的情况下安装vLLM 0.2.3。
(一)服务器环境

(二)安装成功如下图

(三)安装步骤
vLLM官方文档说了只针对cuda

4922

被折叠的 条评论
为什么被折叠?



