[AI绘图]Prompt的基本使用

发布于 2023-04-05  601 次阅读


有几天没有写关于stable diffusion绘图的教程了主要也是没有太多时间这里先写一下关于prompt的基础教程.

影响图象生成的要素

使用stable diffuson进行AI绘画创作时会受到多重因素影响,包括hypernetwork,lora模型以及使用controlnet进行构图等等.但是prompt也就是提示词会影响很多东西,稍微改变一个提示词可能就会有很大的变化.而提示词这种东西本身需要自己进行创作,不想模型可以直接白嫖其他大佬的,当然如果有了好的模型,输入少量的提示词也确实能有不错的效果.

这里主要讲解提示词的基本使用,后面会继续更新ControlNet,lora,latentcouple等等使用,欢迎继续关注.

提示词的性质

首先明确,这种AI绘画确实有种不确定性,也就是经常说的炼丹.但是如果我们多试试也许能测试出其中的规律.

一个提示词可能会改变整张图,随机性比较大,所以如果模型能解决的问题,一般就不用提示词解决了.

比如使用某个人物的lora模型要比使用提示词直接去描述这个人数效果好很多.

举个例子,使用八重神子的lora模型(如果没有可以去civitai网站或者后台私信我,我后面回复一个常用的模型网站列表).脸部使用面部修复,这个模型偏写实,整体还是不错的.

正向提示词

简单来说就是描述你想生成的图片,比如上图的正向词

best quality, ultra high res, 1girl, full body ,school uniform,<lora:yaeMikoRealistic_yaemikoMixed:1>,face

可以考虑从以下几个角度描述:

  1. 确定主题:1girl,1boy 比如上图我就使用了1girl来生成一个女孩
  2. 特定条件 long hair,eyes 用来指定头发,眼睛等
  3. 画面质量 一般就加best quality,masterpiece这种词就行了
  4. 画面风格 cartoon,realistic,这种一般用得少,因为换个模型或是用hypernetwork本身就够了.

注意避免提示词的冲突等.

负向提示词

绘图时一般还要加入一些负向提示词避免不好的结果.在上图种我加的负向提示词有

(worst quality:2),(low quality:2),(normal quality:2), lowres, normal quality, ((monochrome)), ((grayscale)), skin spots, acnes, skin blemishes, age spot, glans,{{{bad_hands}}},badhand, bad_feet,(bad face), 

可以看出来涉及图像质量方面以及防止 手部,脚部以及脸出错.

deforomed, lowres, bad anatomy, text, error, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name

上面是一些常用的负向提示词

注意提示词也不是越多越好,一般不超过150个token.

这里给几个找提示词的网站

  1. Public Prompts
  2. 魔咒百科词典 (aitag.top)

提示词权重

有时有些提示词比较重要或者是输入了这个提示词图像山却没有明显体现,这样就可以提升这个词的权重.

使用 () 增大权重,[]减小权重

比如

(best quality)

表示权重x1.1倍,当然也可以自己更改

比如

(best quality:1.3)

提示词组合

[a|b]

使用|代表在每个步数更换提示词,这样使得生成的图像融合a和b两种特征.

比如我输入提示词

best quality, ultra high res, 1girl, full body ,school uniform,face,blue hair <hypernet:anime:1>, [blue eyes|red eyes|black eyes]

其中[blue eyes|red eyes|black eyes]表示不同颜色的眼睛进行融合,当然这种可能效果并不是很好.

image-20230405141755852

OR

[a:b:占比]

这样会使两个特征都在图像上但按比重出现.

AND

结合a,b特点同时出现,进行融合

orange:1.5 AND apple:2.5

画面效果等可以搭配hypernetwork,视角动画可以搭配controlnet,特征任务可以搭配lora.

更改画面大小

可以通过调节宽高更改图片大小,图片大小也会影响画面中的人物.

image-20230405142655080

画面比较小通常分辨率就比较低,而且图中人物也不会多.

image-20230405142956412

在设置中我们一般会更改采样方法,迭代步数来简单提升图片质量,通过批次数和单批数量来改变生成的图片数量.

CFG scale用于修改提示词整体权重.

种子数如果为-1表示随机生成,否则为固定值,固定种子的情况下其他设置不修改那么生成的图像也就是一样的了.

最后做个下期文章预告,关于LatentCouple生成多人图.

image-20230405155440948

参考资料

  1. Stable Diffusion提示詞寫法教學,附範例 | Ivon的部落格 (ivonblog.com)
  2. 纯干货,细节拉满,AI绘图,stable diffusion新手入门必看,文生图全解_哔哩哔哩_bilibili
届ける言葉を今は育ててる
最后更新于 2023-04-05