掌握提示词,玩转 ComfyUI/StableDiffusion,人人都是艺术家!- Grasp prompt words, conquer ComfyUI/StableDiffusion, and unleash your inner artist!
官网解释文档:
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features
谁说 AI 绘图很难?掌握几个关键技巧,你的提示词立马变强!下面这份"傻瓜式"指南让你秒变提示词高手!
1. 默认权重与提示词长度控制
用法:每个提示词默认权重为1,总词数建议≤75(实际受CLIP模型76token限制)。
好处:避免模型计算过载,提升生成效率。
极值:最小权重0(无效词),理论最大权重无限制但实际需保持总和合理。
计算示例:(sunflower:1.5) 将权重提升50%,相当于 ((sunflower)) 嵌套一层小括号。
2. 括号权重控制
小括号 ( )
用法:每层增加10%权重,如 (word)=1.1,((word))=1.21。
替代语法:(word:1.3) 直接指定权重为1.3,避免多层嵌套。
中括号 [ ]
用法:每层减少10%权重,如 [word]=0.9,[[word]]=0.81。
大括号 { }
用法:混合使用时可自定义权重叠加逻辑,但需手动计算。
注意:仅小括号支持冒号语法直接指定权重值。
示例:如果我们要生成一张包含 “red flower” 和 “blue sky” 的图片,并且希望 “red flower” 更加突出,可以写成 “(red flower:1.5) blue sky”,这样 “red flower” 在生成图像时会得到更多的关注。
3. LoRA模型调用
用法:<lora:模型文件名:强度乘数>,如 <lora:smiling:0.8>。(假设有一个名为 “smiling” 的 LoRA 文件,这样图像中微笑表情会被突出)
好处:微调特定风格,兼容UNet和CLIP模型。
极值:乘数建议0~1(可超1, 但极易失真)。
要求:需将LoRA文件放入指定目录(通常为 models/Lora)。
4. 连接符(下划线)
用法:用下划线连接词组,如 banana_bread。
好处:强制CLIP分词器将词组视为整体,避免歧义(如不连接可能拆分为"banana"和"bread")。
替代方案:引号包裹词组 "banana bread" 也可达到类似效果。
5. Prompt Editing(分步控制)
语法:(注意to 是一个: 而 from是两个::)
[a:0.8]:表示元素 “a” 在生成过程中只在 0.8(即 80%)的步骤之后起作用。比如说: [balls:0.8] on the ground 相比于 [balls:0.1] on the ground, 前一个提示词生成的球的数量就会比较少,因为它只在最后20%的时候起作用。
[a::0.7]:表示元素 “a” 在生成过程中前 0.7(即 70%)的步骤起作用,之后的30%的生成步骤不起作用。比如说: [balls::0.7] on the ground 相比于 [balls::0.1] on the ground, 前一个提示词生成的球的数量就会比较多,因为它在生成过程前70%的部分起作用。
[a:b:16]:表示在第 16 步时,将元素 “a” 替换为元素 “b”。比如说: [cat:dog:10] 表示前10步画猫,后10步改画狗。最后的结果,会融合猫狗的特点,生成新的图片。
好处:精细控制不同生成阶段的画面变化。
极值:步数需≤总生成步数(默认20,可以自定义)。
6. 交替词(动态切换)
用法:使用 [word1|word2|word3] 这样的语法,可以让模型在每一步生成时从列表中选择一个词。这可以用来创造在不同概念之间平滑过渡或混合的效果,或者引入一些随机性和多样性。
好处:每一步随机选择其中一个词,生成混合特征。
示例:a painting in the style of [van gogh|monet|picasso]:生成的画作风格会在梵高、莫奈、毕加索之间交替。
7. 4GB显存支持
启用方式:启动参数添加 --medvram 或 --lowvram。
原理:牺牲生成速度,分批处理模型计算以减少显存占用。
限制:
分辨率可能受限(如≤512x512)。
部分功能(如高清修复)需关闭。
兼容显卡:NVIDIA 4GB+(如GTX 1650、RTX 3050)。