AI绘画入门学习-第二天
#
AI绘画
## Day 2:提示词与参数优化
学习目标:掌握提示词编写技巧,调整参数提升生成质量。
- 实践步骤: 1.
提示词公式:使用“主体+细节+风格+质量”结构(如“a knight
in armor, detailed armor texture, dark fantasy style, 8k,
masterpiece”)。 2.
权重控制:用(keyword:1.5)
增强权重,[keyword]
降低权重。
3. 参数调整: -
采样方法:推荐DPM++ 2M Karras
(速度快且稳定)。 -
迭代步数:20-30步(平衡速度与质量)。 - 提示词相关性(CFG
Scale):7-12(值越高越贴近描述,但可能过锐化)。 -
检验成果:生成一张符合复杂提示词描述的图片(如“科幻城市夜景,赛博朋克风格”)。
为此我研读了这本书,元素同典:确实不完全科学的魔导书
我会在另外一篇文章里面分享自己的 结合书本中的知识以的实战经历[[元素同典:确实不完全科学的魔导书 批注]]
预制提示词测试
这里,大佬给了一个非常棒的风格模板,后面加上想要的提示词大概率能出非常好的图像效果:
1 | (masterpiece, extremely detailed 8k wallpaper,best quality),(best illumination, best shadow, extremely delicate and beautiful),dynamic angle,floating,finely detail,Depth of field (bloom),(shine),glinting stars,classic,(illustration),(painting),(sketch),1girl,solo,bare shoulders,medium breasts,areola,red eyes,beautiful detailed cold face,black hair,straight_hair,short hair,extremely delicate and beautiful girls,beautiful detailed eyes,(((rose))),cage,bandage,(red rope), |
迭代步数和采样方式对结果的影响
在控制同一个seed的情况下,我们可以用 X/Y参照来生成对比图像:
这里,我用提示词为:
1 | masterpiece,1 girl,cute face,black short hair,red eyes,[SFW:(NSFW:1):0.1], |
1 | lowres,bad anatomy,bad hands,text,error,missing fingers,extra digit, |
镜头控制
close up、close shot、medium view、panorama 这几个镜头控制十分好用
吟唱方式
常见的吟唱方式有三种: 1. 字节式 ## 提示词的分割
语法功能
提示词
提示词是用于提示ai需要生成什么样式的图片的引导词,ai会根据你的提示词生成图片。
为什么提示词会有效我们可以从文生图的原理说起: SD等模型使用的都是让使用将一个带有若干个标签的图片,通过不断参杂噪声,让其变为一张纯噪声图作为正向过程让ai去学习,而这个参杂的过程在一定程度上是可逆的,所以说将ai通过这种方式得到的一系列参数求一个逆,我们就可以得到一个能够从一个噪声图生成为我们想要的图片的模型。
也就是说,提示词本质上就是一开始用来训练ai的图片上面带着的标签,了解训练ai的数据的来源,我们可以直到每个标签大概指的是什么意思:Danbooru: Anime Image Board
但是它们可能有的好用有的不好用,一般引用数大于2000的tag都能够出比较好的效果。
这里还有一些小伙伴们自己收集的比较好的tag资料: https://kdocs.cn/l/cre0TwbMkdx3 https://pan.baidu.com/s/11SE4uW0TiXqrHotBfT3hsQ?pwd=pdlk
然后这里是一些比较好的提示词组合,可以以此为范例: 元素法典 第二点五卷——Novel AI 元素魔法全收录 元素法典 第二卷——Novel AI 元素魔法全收录 等等
提示词 权重调整方法
权重控制在咒语中非常重要,这关系着你想要的东西是否合乎心意的获得了AI的重视。
最基础的权重控制为控制prompt在咒语中的位置。越靠前的词汇越受到重视。
权重控制可以通过对prompt加括号进行。() 或 {} 为加强权重,[] 为减弱权重,括号可以一次扩多个词条。(1girl:1.5)括号后对添加 ":1.5"是对词条直接赋予权重,数字即为权重大小。数字越大权重越大,默认1,通常为0-2之间。
目前在webui中()为对其中内容权重乘以1.1,[]为对其中内容除以1.1,而{}在webui版本中不生效。虽然多重括号也能生效,但是这种方法低效且不优雅,例如((((girl))))进行了4次括号,但是只对girl权重增加到了1.4641。
这里强烈推荐使用(prompt:权重数)的方式来进行权重调整。
比如,你可以在提示词中加入[],然后在括号中加入权重数,这样就可以对整个括号内的词条进行权重调整。
此外,webui还支持快速调节:选中一组词,然后按方向键上下(根据编译器版本不同可能是ctrl+方向键)可以直接完成权重调整。
权重调整的高阶技巧
除了上面的方法可以调整权重之外,还可以使用·
1 | [from:to:step] |
它可以在步数进行到 某一阶段时,将prompt 从 from 变成 to。
比如我个人觉得比较好用的一个是[SFW:NSFW:0.1]
,这样可以在推理的早些阶段,生成一个 SFW
的底图,之后,在经过了整体步数的 10% 之后,再转换为 NSFW 的图像。
这样可以保证擦边球的图像不会在早期就生成,而是在后期生成,从而保证了生成的图像的质量。
书写技巧
上面是单个词的方法,但是实际上我们需要的画面并不能使用寥寥几个词就能够描述,想要生成出好的效果,往往需要在多个方面去对于画面进行描述,对于画面中的元素进行控制,这就需要我们将多个提示词组合起来,构成一整句“咒语”。
三种常见的书写方式及其异同
这里直接引用 [[元素同典:确实不完全科学的魔导书.pdf]] 里面的原文了:
咏唱大致有着三种不同形式——最常见的直接咏唱、稍不常见的短句咏唱和堪称行为艺术一般的长咏唱。
假设要生成一个有着黄色头发、蓝色眼眸、白色上衣、红色裙子、黑色裤袜的全身坐姿二次元美少女,且强调服饰颜色,那么这三种咏唱分别看上去大概是这样的:
直接咏唱(pitch 式咏唱):
masterpiece, best quality, 1 girl, (blue eyes), (yellow hair), (white clothes), (red skirt), (black leggings), sitting, full body
短句咏唱(AND 强调咏唱):
masterpiece, best quality, 1 girl, (blue eyes) AND (yellow hair), (white clothes) AND (red skirt) AND (black leggings), sitting, full body
注意短句咏唱的 AND 必须是三个大写字母,AND 两侧的小括号是不必要的(但建议加上),这是一个专用语法,不过因为效果仍未明晰所以不单独介绍。此外,该语法并不能应用于所有采样方法,例如 DDIM 就不支持 AND,会导致报错。
这里似乎有点问题,大写“AND”会导致碎片化图片,但是小写“and”反而可以正常出图,估计是版本更新的问题
长咏唱(自然语言咏唱):
masterpiece, best quality, (1 girl with blue eyes and yellow hair wearing white clothes and red skirt with black leggings), sitting, full body