温馨提示:在 ChatGPT 官网(www.chatgpt.com)使用 GPT-5.5、ChatGPT-Image-2 等模型时,需要 ChatGPT Plus 或更高等级的会员权限。如需购买账号或充值会员,请扫码添加我们客服咨询。
AI绘画的核心工具链包括:**Stable Diffusion(SD)**、**Midjourney(MJ)** 和 **DALL-E 3**,入门首选 SD,因其开源免费,需配置本地环境(推荐显卡8GB显存以上)或使用云端(如AutoDL),上手关键在于掌握**提示词**(正向描述主体、风格、光线;负向屏蔽畸形、坏手)和**参数调整**(采样步数20-30、CFG Scale 7-11),进阶需学习**ControlNet**(控制姿势、深度图)和**LoRA**(固定角色/画风),出图流程:明确需求→搭建提示词→选模型(写实/二次元)→多次抽卡调参→后期用图生图精修局部。
本文目录导读:
这几年AI绘画火得很快,很多人一开始觉得这东西很神奇——输入几个词,就能生成一张图,但真正想用好AI绘画,光会打字是不够的,你需要懂一点工具,懂一点参数,还要知道怎么一步一步把想法变成画面,这篇文章我就从实际使用的角度,把AI绘画需要用到的工具和技巧跟你讲清楚。
先搞清楚你要用哪款AI绘画工具
现在市面上主流的AI绘画工具,主要分三类。
第一类是在线使用的,像Midjourney、DALL·E 3、Stable Diffusion的在线版,这类工具你用浏览器就能打开,不需要装什么复杂软件,适合一开始试水,Midjourney需要在Discord里用,很多人觉得麻烦,但其实你只要加一个Discord账号,跟着引导走一遍,后面就顺手了,它的成片质量很高,特别是光影和细节处理,是目前很多设计圈的人的首选,DALL·E 3是OpenAI做的,直接集成在ChatGPT Plus里,如果你已经有ChatGPT会员,那用起来最方便,不需要额外学任何新界面。
第二类是本地部署的,主要是Stable Diffusion的各种版本,这类工具需要你有一张还行的显卡,显存建议8GB以上,然后装一个叫WebUI的界面,或者现在很多人用的ComfyUI,本地部署的好处是不受限制,想画什么画什么,模型可以随意换,而且不花钱(除了电费),但坏处是门槛高,你需要懂一点Python,会装环境,遇到报错还得自己查,新手直接上手这个,容易被劝退。
第三类是移动端的,像Wombo Dream、NightCafe,或者国内的一些小程序,手机上随便玩玩可以,但精细控制和商用肯定不行。
我的建议是:如果你是第一次接触AI绘画,先试Midjourney,花点时间熟悉它的提示词怎么写,等你能稳定出图了,再考虑要不要学Stable Diffusion。
写提示词是最基础的工具
很多人以为AI绘画就是“想什么就输入什么”,其实不是,提示词是一套相对固定的写法。
你需要告诉AI几个东西:主体是什么(比如一只猫、一个女人、一辆车),什么风格(写实、动漫、油画、水彩),什么环境(白天、夜晚、室内、海边),还有什么角度(正面、俯视、特写、全身),把这些要素拆开放进句式里,AI才能理解你要什么。
举一个例子,如果你只写“一只猫”,AI可能给你一张模糊的侧脸猫,但如果你写“一只橘猫,写实风格,趴在窗台上,下午阳光照进来,毛发光泽清晰”,那出来的效果就完全不一样。
提示词里还有一个重要的东西叫“权重”,在Midjourney里,你可以用“::”来强调某个词的重要程度,猫::2 书::1”,AI就会更侧重于猫,在Stable Diffusion里,更常见的做法是用括号,像“(猫:1.3)”。
一开始写提示词不用太复杂,先掌握“主体+风格+环境”这个公式,等出图稳定了,再加一些细节词,像“电影光效”“浅景深”“4K画质”这些。
反向提示词和参数设置
很多人只知道正面的提示词,不知道AI绘画还有一个“反向提示词”,所谓反向提示词,就是告诉AI“我不要什么”。
比如你不想要手画得畸形,就加“bad hands”,不想要多出来的手指就加“extra fingers”,在Stable Diffusion里,这是一个必填的字段,在Midjourney里,你可以用“--no”参数来实现,--no hands”。
参数方面,你最早会遇到的是“宽高比”,比如1:1、16:9、9:16、3:2这些,在Midjourney里用“--ar”来设,这个参数直接影响构图,风景类的适合16:9,人物肖像适合3:4或者9:16。
还有一个参数叫“CFG Scale”,中文常叫它“提示词相关性”,值越大,AI越严格地按照你的提示词出图,但画面可能变得生硬、不自然;值太小,AI就自由发挥,画面可能会跑偏,一般设7到9之间比较稳妥,在Midjourney里没有直接的CFG参数,你可以通过“--s”(风格化)来调节,数值越大画面越有艺术感,越小越写实。
另外还有一个“种子值(Seed)”,每张图生成时都有一个种子编号,如果你看到一张喜欢的图,记下种子号,下次生成时加同样的种子,再微调提示词,就能得到相似构图的不同变体,这个对保持风格一致非常有帮助。
模型是AI绘画的核心
如果你只用Midjourney,那不用管模型的事,因为Midjourney本身就是一个封闭的大模型,你没法换,但如果你用Stable Diffusion,模型就是你最需要花时间研究的。
Stable Diffusion的模型分好几类,最基础的叫“基模型”,比如SD 1.5、SDXL、SD 3,基模型决定了整体的画风和理解能力,在基模型之上,还有各种“微调模型”,这些是社区训练出来的,专门用来画某种风格,比如画二次元动漫的有Anything V5,画写实人物有ChilloutMix,画科幻场景的有DreamShaper。
在Stable Diffusion里,你还会碰到一个叫“LoRA”的东西,它可以理解成给模型加一个插件的概念,比如你想要画某个人物,或者某个特定的材质,就可以加载对应的LoRA文件,使用方式是在提示词里写类似“<lora:风格名:权重>”的形式,权重也是0到1之间,一般设0.6到0.9。
模型和LoRA的获取,最常用的网站是Civitai(西维塔),上面有成千上万的模型,每个模型下面都有示例图、提示词和参数,你可以直接复制别人的提示词来试,新手去那里就像找到了宝库,别人的成品图就是你最好的参考。
图片修整和放大工具
AI绘画第一次生成出来的图,不一定都是完美的,有时候构图可以,但分辨率太低;有时候整体效果不错,但人脸崩了,这就需要用到后处理工具。
最常见的需求是“放大”,AI绘画原始出图分辨率一般不太高,比如512x512或者1024x1024,如果你想做成海报或者打印,就需要放大,Midjourney本身自带放大功能,出图后按U按钮就行,但效果非常一般,更好的做法是用专门的放大工具,像Topaz Gigapixel AI、Real-ESRGAN,或者ComfyUI自带的放大节点。
另一个常见问题是“修脸”,AI画的正面脸通常没问题,但侧脸或者远处的人脸,五官经常是糊的或者错位的,有一个专门的工具叫Face Restorer,集成在Stable Diffusion的WebUI里,可以一键修复,还有一个更专业的叫CodeFormer,修复之后皮肤会变得更平滑。
如果你想做更精细的修改,比如把背景换掉,或者把某个物体去掉,那就要用“图生图(Img2Img)”模式,这个功能几乎所有AI绘画工具都有,你可以输入一张图作为底图,再写新的提示词,AI会在原图的基础上进行调整,比如你有一张猫的照片,你想给它加个帽子,就可以用这个方式。
找到适合自己的流程
等你对上面这些工具都熟悉了,就可以根据自己的需求搭一个完整的流程,我自己常用的流程是这样的:先在Midjourney里跑几轮,找灵感,确定构图和风格,然后下载满意的图,扔进Stable Diffusion的图生图,用更精细的模型重新生成一次,同时加上修脸和放大,最后再用Photoshop或者一个叫Krita的免费软件做微调。
这个流程花的时间长一点,但质量能保证,如果你只是想要社交软件发一张随手图,那直接用Midjourney就够了,根本不需要本地部署,如果你是做游戏素材或者产品图,那本地部署的Stable Diffusion加上LoRA是必不可少的。
还有一种情况是,你不想学那些复杂的参数,只想快速出图,那你可以用在线服务,比如NovelAI、DreamStudio、Leonardo.ai,这些工具把参数都简化了,你只需要选风格、写提示词就能出图,适合不想折腾的人。
持续学习和跟新
AI绘画工具变化很快,每个月都有新模型,新功能,新插件,去年大家都还在用SD 1.5,今年SDXL和SD 3已经成了主流,Midjourney每两三个月就更新一次版本,参数和用法也在变。
所以你不能只看几篇教程就不管了,我建议你关注几个地方:一是Reddit上r/StableDiffusion和r/Midjourney这两个板块,每天都有新的贴子分享技巧和模型,二是Civitai上的热门模型页面,可以看到别人都在用什么,三是YouTube上的实际教程,很多博主会把最新的用法讲得很清楚。
如果你是做AI绘画内容的,最好是有一个笔记本或者备忘录,看到好的提示词、参数组合、工具更新,随手记下来,时间一长,这些东西就会变成你自己的经验库,你出图的效率也会越来越高。
温馨提示:在 ChatGPT 官网(www.chatgpt.com)使用 GPT-5.5、ChatGPT-Image-2 等模型时,需要 ChatGPT Plus 或更高等级的会员权限。如需购买账号或充值会员,请扫码添加我们客服咨询。


网友评论