前一段时间 Stability AI 发布SD3的时候可谓风雨飘摇,核心算法出走,CEO被迫离职,模型也因为对齐导致出现严重的肢体问题。
之后FLUX就发布了,填补了SD3的生态位置,就在我们都以为 Stability AI 一蹶不振的时候,他带着 SD3.5杀回来了。
官方甚至用了一个躺在地上的女孩做宣传图表达模型能力。
他们直接开源这个系列的三个模型包括:Large 和 Large Turbo,Medium 将于 29 号发布。而且三个型号都可以商用!
模型介绍:
- SD 3.5 Large:80亿参数基础模型,质量最优,提示响应精准,适合1M像素专业应用
- SD 3.5 Large Turbo:Large版本精简型,4步即可生成高质图像,速度更快
- SD 3.5 Medium:25亿参数,采用MMDiT-X架构,适配普通硬件,支持0.25-2M像素输出
核心优势:
- 高适配性:易于微调和应用开发
- 硬件友好:优化设计,适合消费级设备,尤其是 3.5 Medium 和 3.5 Large Turbo。
- 多元输出:无需复杂提示即可生成多样化人物形象
- 风格丰富:支持3D、摄影、绘画等多种视觉风格
- 精准理解:Large版本提示词理解力领先,图像质量可比肩大型模型
其实最核心的部分是SD3.5支持对模型进行微调,而不是只能用Lora缝缝补补,期待社区大佬的SD3.5微调模型。
ComfyUI 已经支持
Comfyui 已经支持 SD3.5,现在就可以用了,只需要更新最新Comfyui。
链接里还有FP8的模型,低显存用户可以使用。
这里是工作流:
https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8/tree/main
Lib已经有SD3.5的Lora了
只能说大家都很快,模型发布的一瞬间,Liblib就上线了三个SD3.5的Lora。
下载链接在这里,可以试试:
https://huggingface.co/Shakker-Labs/SD3.5-LoRA-Linear-Red-Light
https://huggingface.co/Shakker-Labs/SD3.5-LoRA-Futuristic-Bzonze-Colored
https://huggingface.co/Shakker-Labs/SD3.5-LoRA-Chinese-Line-Art
一些测试图:
昨晚临时跑了一些测试图,28步步数有点低,可以多搞几步。
官方公告:https://stability.ai/news/introducing-stable-diffusion-3-5