Midjourney Prompt怎么以图生图?一步步说清楚

ChatGPT2026-05-10 08:24:0829

温馨提示:在 ChatGPT 官网(www.chatgpt.com)使用 GPT-5.5、ChatGPT-Image-2 等模型时,需要 ChatGPT Plus 或更高等级的会员权限。如需购买账号或充值会员,请扫码添加我们客服咨询。

,Midjourney 的以图生图功能通过“垫图”实现,操作步骤:1. 在 Discord 输入框先上传图片(点击“+”号上传),发送后点击图片放大,右键复制图片链接,2. 在对话框输入 /imagine,将链接粘贴到 Prompt 中,并在链接后加上空格和描述文字,3. 可添加 --iw 参数控制图片权重(0.5-2.0,数值越高越接近原图),4. 发送后 Midjourney 会基于原图风格和描述生成新图片,如需调整,可对生成结果使用变体或重绘功能。

本文目录导读:

  1. 什么是“以图生图”
  2. 怎么上传图片
  3. 最基础的以图生图prompt写法
  4. 控制“图片权重”的参数:--iw
  5. 用图片做风格参考:--sref
  6. 用图片做角色参考:--cref
  7. 实际操作的步骤
  8. 常见问题和解决办法
  9. 一些实用的技巧
  10. 什么情况下用“以图生图”更好
  11. 注意事项和坑
  12. 用“以图生图”做设计初稿
  13. 最后一点建议

很多人第一次用Midjourney,都是从“文字生成图片”开始的,你输入一段文字,它给你画出一张图,这个功能很强大,但有时候你会发现,光靠文字描述,很难让AI完全理解你脑子里的那个画面,你可能会想:“如果我有一张参考图,让Midjourney照着这个风格或者构图来画,是不是更好?”

答案是肯定的,Midjourney支持“以图生图”这个功能,你不需要写很长的prompt,只需要上传一张图,再加上一些文字说明,它就能帮你生成新的图片,这篇文章我会把整个流程、技巧、常见问题都讲清楚,你按照我说的做,很快就能上手。

什么是“以图生图”

就是你给Midjourney一张图片作为参考,它根据这张图片的内容、颜色、构图或者风格,再生成一张新的图片,你可以把它理解成“看图说话”——AI看了你的图,然后按照你的文字要求,画出一张新图。

这个功能最实用的地方是:你不需要把每个细节都写出来,比如你想要一张“赛博朋克风格的城市夜景”,你找一张类似的图片作为参考,再加上几个关键词,结果通常比纯文字生成要准确很多。

怎么上传图片

在开始操作之前,你需要先知道怎么把图片发给Midjourney,不管你是用Discord还是网页版,流程都很简单。

在Discord里,你只需要点击输入框左边的“+”号,选择“上传文件”,然后选好图片,发送出去,图片发出去之后,点击它,选择“在浏览器中打开”,复制一下网址,这个网址就是你在prompt里要用到的“图片链接”。

在网页版里更简单,你直接拖拽图片到输入框旁边那个“图像上传”区域就行,系统会自动生成一个链接给你用。

图片链接不能太长太乱,如果你的图片在本地,一定要先上传到一个能直接访问的地方,比如Discord本身就可以当图床用。

最基础的以图生图prompt写法

现在你有了图片链接,接下来就是写prompt,最基本的格式是这样:

[图片链接] [文字描述]

举个例子,你上传了一张夕阳下的海滩照片,然后想让它变成“动漫风格”,你可以这样写:

https://example.com/beach.jpg anime style, sunset beach

然后回车,Midjourney就会根据你那张海滩照片的样子,生成一张动漫风格的夕阳海滩。

但要注意,光给一张图+简单几个词,结果可能和你想象的不太一样,因为Midjourney会尽量保留原图的构图、颜色和物体位置,但风格会按照你的提示来变,如果你想让它改动更大一些,就需要在文字部分写得更详细。

控制“图片权重”的参数:--iw

这是以图生图里最重要的一个参数,它的全称是“image weight”,中文可以叫“图片权重”,这个参数决定了Midjourney有多看重你的参考图。

参数范围是0到3,默认值是1,数值越大,生成的结果越像原图;数值越小,AI越自由发挥。

举个例子:

你上传一张真实照片,然后写“a painting of a cat”,如果你不加--iw参数,结果可能是一只猫,但背景、光线都和原图差不多。

如果你加上--iw 2,那结果会更接近原图,比如猫的位置、姿势、颜色都和原图很像。

如果你加上--iw 0.5,那AI就会更看重你的文字描述,生成一只更像“画出来的猫”,但和原图的相似度会降低。

所以你要根据需求来调这个值,如果你想保留原图的构图,就用高一点的iw值,如果你想换风格,但保留一些原图的感觉,就用默认或者低一点的。

用图片做风格参考:--sref

如果你只是想要原图的“风格”,而不是它的具体内容,那可以用--sref参数,这个参数是Midjourney后来加的功能,专门用来提取图片的风格特征,比如颜色、纹理、光影效果。

用法也很简单:

[图片链接] [文字描述] --sref [风格图片链接]

这样写,AI会把风格图片里的颜色、笔触、光影应用到你的文字描述上,比如你有一张水墨画的图片,你想让AI用这个风格去画一只猫,你可以写:

a cat --sref https://example.com/ink_painting.jpg

这样生成的猫就会有水墨画的感觉,这个参数非常实用,特别是你想模仿某个画师风格,或者想要某种特定材质效果的时候。

用图片做角色参考:--cref

还有一个参数是--cref,它专门用来保持“角色一致性”,比如你有一张角色的脸,你想让这个角色出现在不同的场景里,那就可以用这个参数。

用法:

a knight in a forest --cref https://example.com/face.jpg

这样生成的图片里,角色的脸会尽量保持和你提供的参考图一样,这个功能在画漫画、做游戏角色设计时很有用。

不过要注意,--cref出来的脸不会完全一模一样,只是尽量接近,如果你需要更精确的角色保持,可以把--iw也调高一点。

实际操作的步骤

现在我把整个流程走一遍,你跟着做就行。

第一步,找到一张你想要的参考图,可以是自己拍的,也可以是网上找的,注意版权问题,不要随便用别人有版权的图。

第二步,把图片上传到你的Discord频道或者Midjourney网页版,在Discord里点“+”上传,发送出去,然后复制图片链接。

第三步,在输入框里先粘贴图片链接,空一格,再写你的文字描述。

https://example.com/old_building.jpg a futuristic city with neon lights, cyberpunk style

第四步,根据需求加上参数,比如你想保留原图的构图,可以加上--iw 2,如果你想要更好的效果,可以加上--ar 16:9来调整比例。

第五步,按回车,等待生成。

第六步,看结果,如果不满意,可以调整文字描述或者iw值再试一次。

常见问题和解决办法

很多人第一次试的时候会遇到一些问题,我列几个最常见的。

生成的图片和原图完全不一样。 原因通常是文字描述太强,或者iw值太低,你可以把iw值调到2或者3,这样AI会更尊重原图。

生成的图片太像原图,几乎没变化。 原因是你给的文字描述太少,或者iw值太高,你可以降低iw值,或者文字描述写得更多、更具体。

图片颜色变奇怪了。 这是因为参考图片本身颜色比较特殊,或者你的文字描述里包含了冲突的颜色词,你可以试着去掉颜色词,只用风格词。

图片里出现多余的东西。 比如你只想要一个人,但背景里多了一些奇怪物体,这时候你可以把文字描述写得再精确一点,一个人站在白色背景前,没有其他东西”。

图片比例不对。 这个好解决,直接在prompt最后加上--ar 16:9或者--ar 1:1之类的比例参数,注意,Midjourney不会自动裁剪原图,它只是按照比例生成新图。

一些实用的技巧

用“--no”参数排除不想要的东西。 比如你不想图片里有树,就在最后加上--no tree,这样可以避免AI自动加一些你不想要的内容。

多张图片混合使用。 你可以一次给多个图片链接,比如一张图片你提供构图,另一张图片你提供颜色,AI会综合参考,格式就是:

[构图图链接] [颜色图链接] [文字描述]

用“--style raw”减少艺术化处理。 如果你想要更真实的效果,可以加上--style raw,这个参数会让Midjourney减少它对图片的“美化”,结果更贴近你的参考图。

先试小尺寸再放大。 如果你不确定效果,可以先不要输入--quality参数,默认就是1,等看到满意的小图了,再点U按钮放大。

参考图尽量高清。 低分辨率的图片会影响最终效果,最好用清晰、噪点少的图片作为参考。

什么情况下用“以图生图”更好

不是所有时候都适合用这个功能,我总结了几种最适合的场景。

第一种,你想换风格,但保留原图的内容,比如你有一张真人照片,想把它画成皮克斯动画风格,用iw值2左右,再配合--sref参数,效果很稳。

第二种,你想延续某个画风,但内容完全不同,比如你有一张梵高风格的星空图,你想用同样的笔触去画一只狗,这时候用--sref就行,不需要上传内容图。

第三种,你想固定角色,但画在不同的场景里,用--cref参数,加上不同的文字描述,角色脸会保持相似。

第四种,你想修图,但PS不会用,比如你想把一张白天照片改成夜晚,或者把一个人去掉,虽然Midjourney不是专门的修图工具,但用高iw值+文字描述,有时候也能做到。

注意事项和坑

第一个坑:参考图不能太大。 虽然Midjourney支持大图,但如果你的图片有几兆甚至更大,上传和生成速度都会变慢,建议压缩到1兆以下,宽度不超过2000像素。

第二个坑:不要用带文字很多的图片。 Midjourney目前对图片里的文字识别不好,生成的结果里文字通常会扭曲或者消失,如果你图片里有重要文字,建议先去掉。

第三个坑:人脸容易崩。 特别是用--cref的时候,侧脸或者仰视角度容易出问题,如果你想要保持人脸,尽量选正面或者微侧面的照片,表情不要太夸张。

第四个坑:版权问题。 虽然Midjourney生成的图片由你拥有使用权,但如果你用了别人有版权的参考图,生成的结果可能会有风险,尽量用自己拍的照片或者授权图。

用“以图生图”做设计初稿

这个方法在创意设计里很好用,比如你是平面设计师,客户给了一张参考图,说“我想要类似的感觉,但换成另一个主题”,你可以把客户图上传,再写新的主题词,生成几个方向给客户挑。

或者你是在做游戏概念设计,手头有一些参考照片,你可以快速把它们风格化,变成统一的画风。

这个方法比纯文字描述要省时间,而且结果更可控,你不需要每次都从零开始写很长的prompt,因为图片本身已经提供了大量信息。

最后一点建议

刚开始用“以图生图”的时候,别急着追求完美,先试几个简单的prompt,看看AI怎么理解你的图片,慢慢你就能摸清楚iw值的规律,还有哪些文字描述效果更好。

你可以把自己试过的图片和prompt记下来,方便以后对比,因为Midjourney每次生成的图都不一样,同一条prompt重复跑,结果也会变化。

如果你试了很多次还是达不到想要的效果,不妨换个参考图试试,有时候不是prompt的问题,而是原图本身不太适合AI处理。

以图生图这个功能,能让你更灵活地控制Midjourney的输出,它不是一个复杂的技巧,只要多练几次,你就能用得很顺手。

温馨提示:在 ChatGPT 官网(www.chatgpt.com)使用 GPT-5.5、ChatGPT-Image-2 等模型时,需要 ChatGPT Plus 或更高等级的会员权限。如需购买账号或充值会员,请扫码添加我们客服咨询。

本文链接:https://www.lexitong.com/ai/2333.html

MidjourneyPromptMidjourneyprompt怎么以图生图

相关文章

网友评论