Windows下成功安装SageAttention和triton

该文章已生成可运行项目,

SageAttention 是最近在一些大模型框架(特别是像 Wan2.2Qwen2.5DeepSeek-V2 等视频/多模态模型)中开始出现的一个新的 注意力机制优化组件

它主要是为了解决传统 Transformer 中 Attention 的速度瓶颈和显存开销 问题的。

SageAttention 是一种「高效节能版」的注意力机制, 通过稀疏化和 GPU 内核优化让视频生成模型更快、更省显存, 相当于 FlashAttention 的“下一代”。

如果你要在Windows下面直接使用pip install SageAttention 往往都会遇到问题。所以专门开一个帖子记录一下安装方法。

首先安装一下triton。

Github地址:

https://github.com/woct0rdho/triton-windows

安装trition需要注意Pytorch的版本,他们之间的对应关系如下:

PyTorchTriton
2.43.1
2.53.1
2.63.2
2.73.3
2.83.4
2.93.5

比如我的Pytorch是2.8,可以安装Triton3.4。

安装命令:

pip install -U "triton-windows<3.5"

ComfyUI便携版安装命令:

python.exe -m pip install -U "triton-windows<3.5"

然后在安装SageAttention

Github地址:

https://github.com/woct0rdho/SageAttention

安装SageAttention需要事先把对应的whl文件下载到本地。

可以从下面这个地址找到合适的版本:

https://github.com/woct0rdho/SageAttention/releases

这里需要注意Cuda版本,Torch版本,Python版本。

红色框中选中的文件适用于cuda 为12.8,torch为2.8.0,Python为3.13。

必须根据自己环境来选择合适的文件,这里基本涵盖了常见的版本。

然后运行安装命令。

常规安装命令:

pip install sageattention-2.2.0+cu128torch2.8.0-cp313-cp313-win_amd64.whl

ComfyUI便携版命令:

python.exe -m pip install sageattention-2.2.0+cu128torch2.8.0-cp313-cp313-win_amd64.whl

SageAttention 安装成功之后,就可以在Windows环境下启用加速功能了,一般会有比较明显的提速效果。

如果你是在ComfyUI中使用,可能会遇到另外一个问题。在执行tcc.exe的时候报错。这是因为便携版的Python文件中缺少了两个文件而导致。

具体解决方案可以参考这篇文章:https://www.tonyisstark.com/3953.html

本文章已经生成可运行项目
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值