稳定扩散模型(stable diffusion model)是一种用于图像生成的深度学习模型,其特点是可以逐步生成逼真的高分辨率图像。与传统的生成对抗网络(GANs)不同,稳定扩散模型使用的是一个稳定的扩散过程,从而能够减轻GANs中存在的一些问题,例如训练的不稳定性和生成的图像的失真。
AI创作目前最成熟的就是稳定扩散模型,其生成过程可以分为两个阶段:第一个阶段是从噪声图像中生成初始图像,第二个阶段是使用稳定的扩散过程逐步改进图像的质量和细节。下面是稳定扩散模型生成图像的具体步骤:
初始化:模型首先从随机噪声图像中生成一个初始图像,这个图像具有低分辨率和低质量。扩散过程:接下来,模型将使用一个稳定的扩散过程来改善图像的质量和细节。该过程可以被视为一个热力学系统,在该系统中,能量会从低到高地扩散,直到达到一个稳定的状态。在这个过程中,图像的质量和细节将逐步提高,同时图像的分辨率也会逐步增加。扩散方程:稳定扩散模型使用一个称为“扩散方程”的数学公式来控制图像的演化。扩散方程基于偏微分方程(PDE),它描述了一个粒子在空间中的扩散行为。在图像生成过程中,扩散方程用于描述图像中每个像素的演化过程。扩散系数:扩散方程中有一个重要的参数,称为“扩散系数”,它控制着扩散过程的速度和稳定性。在稳定扩散模型中,扩散系数会随着时间的推移而减小,这意味着扩散过程会逐渐变得稳定,直到图像达到最终稳定状态。生成高分辨率图像:稳定扩散模型可以在逐步提高图像分辨率的同时,生成高质量的图像。在图像生成过程中,模型会不断增加分辨率,以逐渐提高图像的清晰度和细节。
当然,利用其它技术,例如LORA还可以进一步生成多样化图像,例如引入著名的cuteGirlMix可以精修人物角色,使创建的美女角色更加可爱生动:
扩散模型前期
扩散模型后期
扩散模型生成图片的样例:
欢迎大家关注,收藏,持续科普和分享高质量图片。