最近,基于扩散的生成网络,如 Stable Diffusion、DALL-E2、Imagen 等,获得了广泛关注。在本文中,我尝试介绍扩散模型的一些基础知识。扩散模型的基础是统计学和数学。因此,包括一些概念的统计复习。
本文分为多个部分——开始、基本概念、DULNT 和 DDPM 代码、DDPM 论文中一些方程的推导、βt 计划和培训、最新技术(ish、)、统计复习、词汇表、和参考资料。最后几节的内容多于理解扩散模型所需的内容。
本文中的很多内容,特别是 Statistics Refresher 部分,是从参考资料部分提到的优秀书籍和文章中派生或自由提取的。
文章中的方程式以多种形式编写——伪代码、Mathcha 等。伪代码方程式更容易编写,但很快就会变得难以理解。写 Mathcha 方程有点费力,但最终结果更令人愉快。