Stable Diffusion 是开源的文本生成图片模型,Prompt是结构化文本抽象。
通过输入和调整Prompt可以生成精美的图片,而Prompt的输入有很多技巧,句式,修饰词等。
通过简单的Prompt入门可以快速掌握生成技巧。Prompt并不是机器语言,它没有严格的语法规范,它更像是一种创作的灵感,是与机器沟通时的一种模糊的指令输入。
本文章除了学习Prompt的技巧以外还包括Stable Diffusion的重要参数,这样基本可以有把握的控制SD的输出。
prompt的基本构成:
A painting of a cute goldendoodle wearing a suit, natural light, in the sky, with bright colors, by Studio Ghibli
photo or painting 这是定图片基调 是照片写实还是绘画风格
2. a cute goldendoodle wearing a suit 主角[subject]是什么
3. 修饰词 光线,风格,背景等。修饰词是一个Prompt编写关键,里面有很多技巧
Prompt的权重
A painting of a cute goldendoodle in the sky, wearing a suit, natural light, with bright colors, by Studio Ghibli
in the sky 提前到第一句, 现在sky的感觉更明显了。
Prompt修饰词 modifiers
Stable Diffusion里面有很多魔法词汇。不同的版本里面魔法词汇的作用也有差异。
修饰词概览图
后面还有很重要的艺术家和艺术风格的修饰词,还有负反馈的prompt。这些等下一部分详细介绍, 这里先略过。
Stable Diffusion 重要参数
Resolution 像素 512×512是默认, 新版SD2是有726×726的 Classifier Free Guidance (CFG) 默认7 , 数值越大越按照Prompt的描述执行。但不代表效果更好, 留有余地让算法自动填补和修正图片是更好的选择。 Step count 步数默认 20 , SD画图可以理解为一个降噪过程,一般步数越多效果也好。不影响显存占用,但是直接增加生成时间Seed 是一个常用的参数,生成initial noise。 通过随机的Seed可以获得不同的图片, 同一个prompt(包括其他采样器参数)在相同的seed下面会生成同样的图片sampler 采样器。 降噪过程使用,不同采样器的效果会不一样。
下篇为大家详细介绍Prompt的mogic word以及常见的调参技巧。