Rectified Flow和Stable Diffusion的关系

Stable Diffusion 从最初的版本发展到最新的 Stable Diffusion 3，其中一个核心的技术进化就是引入了 Rectified Flow。这项技术显著提升了图像生成的速度和质量。为了帮你快速把握它们的关系，下面这个表格梳理了核心的要点：

特性维度	Stable Diffusion (传统扩散模型)	结合 Rectified Flow 的 Stable Diffusion
核心路径	噪声到数据的弯曲路径，像曲折的山路	噪声到数据的直线路径，像笔直的高速公路
采样效率	较低，通常需要数百甚至上千步迭代	很高，几步到几十步就能获得高质量结果
生成质量	路径复杂易导致误差累积，影响质量	直线路径减少误差，图像更清晰、细节更佳
技术理念	基于概率扩散，通过逐步去噪	基于流匹配（Flow Matching），直接学习向量场

Rectified Flow 对 Stable Diffusion 的改进是根本性的，主要体现在以下两个层面：

路径取直：把“弯路”变“直路”
传统的扩散模型需要一步一步、小心翼翼地将纯噪声“翻译”成图像，这个过程就像在曲折的山路上开车，必须不断调整方向，速度很慢。而 Rectified Flow 的核心思想非常简单粗暴：用一条直线连接噪声和数据点。这就好比在两地之间修建了一条高速公路，你可以一脚油门，快速直达，这直接带来了采样速度的巨大提升。
训练目标优化：更聪明地学习
为了实现这条“直线路径”，Rectified Flow 在训练时不再拘泥于复杂的概率计算。它采用了一种称为 “流匹配”（Flow Matching） 的方法，其目标是让神经网络学会一个直线速度场。你可以理解为，它不是去记忆每一个弯道该怎么转，而是直接学习如何在一条直线上以最合适的速度前进。

将 Rectified Flow 融入 Stable Diffusion，带来了立竿见影的好处：

这项技术并非纸上谈兵，已经应用于最新的模型。于2024年发布的 Stable Diffusion 3 (SD3) 就正式采用了基于 Rectified Flow 的框架。

SD3 报告指出，Rectified Flow 策略是其实现更高效、更高质量图像生成的关键技术之一。它与全新的多模态扩散Transformer (MMDiT) 架构强强联合，不仅在图像质量上超越了前代模型，而且在文字渲染和对提示词的遵循能力上取得了巨大进步。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。