SD3.5模型详细测评！Stability.AI 发布 SD3.5 Large 模型，能否逆风翻盘超越FLUX？

原创已于 2024-10-23 14:12:52 修改 · 4.8k 阅读

·

26

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

于 2024-10-23 11:01:14 首次发布

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

基于官方 Qwen-Image 基础镜像定制优化，适配 RTX 4090D 24GB 显存环境，预装 CUDA 12.4、对应驱动 550.90.07，配置 10 核 CPU / 120GB 内存运行环境，内置通义千问视觉语言模型依赖库、推理脚本与常用工具，开箱即用，支持大模型快速加载、图像理解、多模态推理等任务，无需重复配置环境。

原文链接：全网最详细图文测评！Stability.AI 发布 SD3.5 Large 模型，能否逆风翻盘超越FLUX？ (chinaz.com)

SD3.5 的前世今生

6 月的时候，Stability AI发布了 Stable Diffusion 3 Medium，但是在在 FLUX 发布后 SD3 基本沦为弃子，由于各方面都被 FLUX 吊打，加上Stability AI 的霸王条款让 SD3 口碑直线下滑。这次官方吸取了教训，进一步开发了 3.5 版本，并且承诺SD3.5 即为构建者和创作者提供可广泛访问、尖端且在大多数用例中免费的工具

模型特点

就在几小时前，Stability AI 正式发布了 Stable Diffusion 3.5「large」版本。

这次更新有两大显著特点：

① 模型风格多样性提升，用户可通过修改提示词调取更多的图像风格

② 图像生成的 AI 质感降低，在光影和材质上更加自然，使生成的图像更具真实感

这次Stability AI 共发布了两个版本： Large 版本和 Large Turbo 版本

官方声称还有个 Medium 版本将在 10 月 29 号发布

目前两个版本的介绍：

Stable Diffusion 3.5 Large：该基本模型具有 80 亿个参数，具有卓越的质量和及时的依从性，是 Stable Diffusion 系列中最强大的。此型号非常适合 1 MP 分辨率的专业用例。
Stable Diffusion 3.5 Large Turbo：Stable Diffusion 3.5 Large 的精简版本只需 4 个步骤即可生成具有出色快速粘附性的高质量图像，使其比 Stable Diffusion 3.5 Large 快得多。

下图是官方提供的模型对比，可以看出美学不如 FLUX.1Dev，提示词遵循是目前最好的。

所以我们就测试一下 SD3.5 的水平到底如何，通过对比 FLUX 看看能否逆风翻盘重回 AI 绘图领域的巅峰

更详细的介绍在官方发布页：Stable Diffusion 3.5 — Stability AI

在线体验

Large 在线体验：https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large

Turbo 在线体验：https://huggingface.co/spaces/stabilityai/stable-diffusion-3.5-large-turbo

模型下载

Large 下载：https://huggingface.co/stabilityai/stable-diffusion-3.5-large

Turbo 下载：https://huggingface.co/stabilityai/stable-diffusion-3.5-large-turbo

第一次下载的需要填一份联系信息才能下载

模型使用

我们下载官方提供的示例工作流和模型，模型放在 ComfyUI\models\checkpoints 中

把工作流拖入 ComfyUI 中，如果有缺失节点就安装缺失节点。如果之前有用过SD3的小伙伴应该是都安装过这些节点的。

我们需要加载三个 Clip 模型，没有的小伙伴可以在这里下载：https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main/text_encoders

下载完放在ComfyUI\models\clip 文件夹中

想追求最好的效果可以把 T5xxl 换成 FP16 版本的

出图效果

SD3.5 的出图非常占显存即使是 4090 24G 显存也非常容易被跑满，正常跑一张 1024*1024 的图大概要 40s

总结

通过上图的对比可以说是各有优缺点

SD3.5这里人物的手还是有问题，可能开发团队也知道这些问题，所以藏手的情况会比FLUX更明显一点

优点是SD3.5出图有时候更写实，FLUX对皮肤的绘制一般都比较油腻，SD3.5比较细腻更真实一点

长文本和提示词遵循的效果我觉得两者都差不多

美学方面有时候SD3.5会更好一些

性能方面SD3.5不如FLUX，出图比FLUX久显存占用还更多

不过目前FLUX生态更完善，所以短时间SD3.5应该还是超越不了FLUX的

您可能感兴趣的与本文相关的镜像

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen-Image 定制镜像 | RTX4090D CUDA12.4 大模型推理专用

Qwen

图片生成

ComfyUI

基于官方 Qwen-Image 基础镜像定制优化，适配 RTX 4090D 24GB 显存环境，预装 CUDA 12.4、对应驱动 550.90.07，配置 10 核 CPU / 120GB 内存运行环境，内置通义千问视觉语言模型依赖库、推理脚本与常用工具，开箱即用，支持大模型快速加载、图像理解、多模态推理等任务，无需重复配置环境。

标签

#人工智能 #stable diffusion #ComfyUI #AIGC #Flux

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。