Midjourney Prompt怎么以图生图？一步步说清楚

chatgpt官网入口2026-05-10 08:24:0859

温馨提示：在 ChatGPT 官网（www.chatgpt.com）使用 GPT-5.5、ChatGPT-Image-2 等模型时，需要 ChatGPT Plus 或更高等级的会员权限。如需购买账号或充值会员，请扫码添加我们客服咨询。

，Midjourney 的以图生图功能通过“垫图”实现，操作步骤：1. 在 Discord 输入框先上传图片（点击“+”号上传），发送后点击图片放大，右键复制图片链接，2. 在对话框输入 /imagine，将链接粘贴到 Prompt 中，并在链接后加上空格和描述文字，3. 可添加 --iw 参数控制图片权重（0.5-2.0，数值越高越接近原图），4. 发送后 Midjourney 会基于原图风格和描述生成新图片，如需调整，可对生成结果使用变体或重绘功能。

本文目录导读：

什么是“以图生图”
怎么上传图片
最基础的以图生图prompt写法
控制“图片权重”的参数：--iw
用图片做风格参考：--sref
用图片做角色参考：--cref
实际操作的步骤
常见问题和解决办法
一些实用的技巧
什么情况下用“以图生图”更好
注意事项和坑
用“以图生图”做设计初稿
最后一点建议

很多人第一次用Midjourney,都是从“文字生成图片”开始的，你输入一段文字，它给你画出一张图，这个功能很强大，但有时候你会发现，光靠文字描述，很难让AI完全理解你脑子里的那个画面，你可能会想：“如果我有一张参考图，让Midjourney照着这个风格或者构图来画，是不是更好？”

答案是肯定的,Midjourney支持“以图生图”这个功能，你不需要写很长的prompt，只需要上传一张图，再加上一些文字说明，它就能帮你生成新的图片，这篇文章我会把整个流程、技巧、常见问题都讲清楚，你按照我说的做，很快就能上手。

什么是“以图生图”

就是你给Midjourney一张图片作为参考,它根据这张图片的内容、颜色、构图或者风格，再生成一张新的图片，你可以把它理解成“看图说话”——AI看了你的图，然后按照你的文字要求，画出一张新图。

这个功能最实用的地方是：你不需要把每个细节都写出来，比如你想要一张“赛博朋克风格的城市夜景”，你找一张类似的图片作为参考，再加上几个关键词，结果通常比纯文字生成要准确很多。

怎么上传图片

在开始操作之前,你需要先知道怎么把图片发给Midjourney，不管你是用Discord还是网页版，流程都很简单。

在Discord里,你只需要点击输入框左边的“+”号，选择“上传文件”，然后选好图片，发送出去，图片发出去之后，点击它，选择“在浏览器中打开”，复制一下网址，这个网址就是你在prompt里要用到的“图片链接”。

在网页版里更简单,你直接拖拽图片到输入框旁边那个“图像上传”区域就行，系统会自动生成一个链接给你用。

图片链接不能太长太乱,如果你的图片在本地，一定要先上传到一个能直接访问的地方，比如Discord本身就可以当图床用。

最基础的以图生图prompt写法

现在你有了图片链接,接下来就是写prompt，最基本的格式是这样：

[图片链接] [文字描述]

举个例子,你上传了一张夕阳下的海滩照片，然后想让它变成“动漫风格”，你可以这样写：

https://example.com/beach.jpg anime style, sunset beach

然后回车,Midjourney就会根据你那张海滩照片的样子，生成一张动漫风格的夕阳海滩。

但要注意,光给一张图+简单几个词，结果可能和你想象的不太一样，因为Midjourney会尽量保留原图的构图、颜色和物体位置，但风格会按照你的提示来变，如果你想让它改动更大一些，就需要在文字部分写得更详细。

控制“图片权重”的参数：--iw

这是以图生图里最重要的一个参数,它的全称是“image weight”，中文可以叫“图片权重”，这个参数决定了Midjourney有多看重你的参考图。

参数范围是0到3,默认值是1，数值越大，生成的结果越像原图；数值越小，AI越自由发挥。

举个例子：

你上传一张真实照片,然后写“a painting of a cat”，如果你不加--iw参数，结果可能是一只猫，但背景、光线都和原图差不多。

如果你加上--iw 2，那结果会更接近原图，比如猫的位置、姿势、颜色都和原图很像。

如果你加上--iw 0.5，那AI就会更看重你的文字描述，生成一只更像“画出来的猫”，但和原图的相似度会降低。

所以你要根据需求来调这个值,如果你想保留原图的构图，就用高一点的iw值，如果你想换风格，但保留一些原图的感觉，就用默认或者低一点的。

用图片做风格参考：--sref

如果你只是想要原图的“风格”，而不是它的具体内容，那可以用--sref参数，这个参数是Midjourney后来加的功能，专门用来提取图片的风格特征，比如颜色、纹理、光影效果。

用法也很简单：

[图片链接] [文字描述] --sref [风格图片链接]

这样写,AI会把风格图片里的颜色、笔触、光影应用到你的文字描述上，比如你有一张水墨画的图片，你想让AI用这个风格去画一只猫，你可以写：

a cat --sref https://example.com/ink_painting.jpg

这样生成的猫就会有水墨画的感觉,这个参数非常实用，特别是你想模仿某个画师风格，或者想要某种特定材质效果的时候。

用图片做角色参考：--cref

还有一个参数是--cref，它专门用来保持“角色一致性”，比如你有一张角色的脸，你想让这个角色出现在不同的场景里，那就可以用这个参数。

用法：

a knight in a forest --cref https://example.com/face.jpg

这样生成的图片里,角色的脸会尽量保持和你提供的参考图一样，这个功能在画漫画、做游戏角色设计时很有用。

不过要注意,--cref出来的脸不会完全一模一样，只是尽量接近，如果你需要更精确的角色保持，可以把--iw也调高一点。

实际操作的步骤

现在我把整个流程走一遍,你跟着做就行。

第一步,找到一张你想要的参考图，可以是自己拍的，也可以是网上找的，注意版权问题，不要随便用别人有版权的图。

第二步,把图片上传到你的Discord频道或者Midjourney网页版，在Discord里点“+”上传，发送出去，然后复制图片链接。

第三步,在输入框里先粘贴图片链接，空一格，再写你的文字描述。

https://example.com/old_building.jpg a futuristic city with neon lights, cyberpunk style

第四步,根据需求加上参数，比如你想保留原图的构图，可以加上--iw 2，如果你想要更好的效果，可以加上--ar 16:9来调整比例。

第五步,按回车，等待生成。

第六步,看结果，如果不满意，可以调整文字描述或者iw值再试一次。

常见问题和解决办法

很多人第一次试的时候会遇到一些问题,我列几个最常见的。

生成的图片和原图完全不一样。原因通常是文字描述太强，或者iw值太低，你可以把iw值调到2或者3，这样AI会更尊重原图。

生成的图片太像原图,几乎没变化。原因是你给的文字描述太少，或者iw值太高，你可以降低iw值，或者文字描述写得更多、更具体。

图片颜色变奇怪了。这是因为参考图片本身颜色比较特殊，或者你的文字描述里包含了冲突的颜色词，你可以试着去掉颜色词，只用风格词。

图片里出现多余的东西。比如你只想要一个人，但背景里多了一些奇怪物体，这时候你可以把文字描述写得再精确一点，一个人站在白色背景前，没有其他东西”。

图片比例不对。这个好解决，直接在prompt最后加上--ar 16:9或者--ar 1:1之类的比例参数，注意，Midjourney不会自动裁剪原图，它只是按照比例生成新图。

一些实用的技巧

用“--no”参数排除不想要的东西。比如你不想图片里有树，就在最后加上--no tree，这样可以避免AI自动加一些你不想要的内容。

多张图片混合使用。你可以一次给多个图片链接，比如一张图片你提供构图，另一张图片你提供颜色，AI会综合参考，格式就是：

[构图图链接] [颜色图链接] [文字描述]

用“--style raw”减少艺术化处理。如果你想要更真实的效果，可以加上--style raw，这个参数会让Midjourney减少它对图片的“美化”，结果更贴近你的参考图。

先试小尺寸再放大。如果你不确定效果，可以先不要输入--quality参数，默认就是1，等看到满意的小图了，再点U按钮放大。

参考图尽量高清。低分辨率的图片会影响最终效果，最好用清晰、噪点少的图片作为参考。

什么情况下用“以图生图”更好

不是所有时候都适合用这个功能,我总结了几种最适合的场景。

第一种,你想换风格，但保留原图的内容，比如你有一张真人照片，想把它画成皮克斯动画风格，用iw值2左右，再配合--sref参数，效果很稳。

第二种,你想延续某个画风，但内容完全不同，比如你有一张梵高风格的星空图，你想用同样的笔触去画一只狗，这时候用--sref就行，不需要上传内容图。

第三种,你想固定角色，但画在不同的场景里，用--cref参数，加上不同的文字描述，角色脸会保持相似。

第四种,你想修图，但PS不会用，比如你想把一张白天照片改成夜晚，或者把一个人去掉，虽然Midjourney不是专门的修图工具，但用高iw值+文字描述，有时候也能做到。

注意事项和坑

第一个坑：参考图不能太大。虽然Midjourney支持大图，但如果你的图片有几兆甚至更大，上传和生成速度都会变慢，建议压缩到1兆以下，宽度不超过2000像素。

第二个坑：不要用带文字很多的图片。 Midjourney目前对图片里的文字识别不好，生成的结果里文字通常会扭曲或者消失，如果你图片里有重要文字，建议先去掉。

第三个坑：人脸容易崩。特别是用--cref的时候，侧脸或者仰视角度容易出问题，如果你想要保持人脸，尽量选正面或者微侧面的照片，表情不要太夸张。

第四个坑：版权问题。虽然Midjourney生成的图片由你拥有使用权，但如果你用了别人有版权的参考图，生成的结果可能会有风险，尽量用自己拍的照片或者授权图。

用“以图生图”做设计初稿

这个方法在创意设计里很好用,比如你是平面设计师，客户给了一张参考图，说“我想要类似的感觉，但换成另一个主题”，你可以把客户图上传，再写新的主题词，生成几个方向给客户挑。

或者你是在做游戏概念设计,手头有一些参考照片，你可以快速把它们风格化，变成统一的画风。

这个方法比纯文字描述要省时间,而且结果更可控，你不需要每次都从零开始写很长的prompt，因为图片本身已经提供了大量信息。

最后一点建议

刚开始用“以图生图”的时候，别急着追求完美，先试几个简单的prompt，看看AI怎么理解你的图片，慢慢你就能摸清楚iw值的规律，还有哪些文字描述效果更好。

你可以把自己试过的图片和prompt记下来,方便以后对比，因为Midjourney每次生成的图都不一样，同一条prompt重复跑，结果也会变化。

如果你试了很多次还是达不到想要的效果,不妨换个参考图试试，有时候不是prompt的问题，而是原图本身不太适合AI处理。

以图生图这个功能,能让你更灵活地控制Midjourney的输出，它不是一个复杂的技巧，只要多练几次，你就能用得很顺手。

温馨提示：在 ChatGPT 官网（www.chatgpt.com）使用 GPT-5.5、ChatGPT-Image-2 等模型时，需要 ChatGPT Plus 或更高等级的会员权限。如需购买账号或充值会员，请扫码添加我们客服咨询。

本文链接：https://www.lexitong.com/ai/2333.html

Midjourney Prompt Midjourneyprompt怎么以图生图

Midjourney Prompt怎么以图生图？一步步说清楚

ChatGPT 会员代充值服务

什么是“以图生图”

怎么上传图片

最基础的以图生图prompt写法

控制“图片权重”的参数：--iw

用图片做风格参考：--sref

用图片做角色参考：--cref

实际操作的步骤

常见问题和解决办法

一些实用的技巧

什么情况下用“以图生图”更好

注意事项和坑

用“以图生图”做设计初稿

最后一点建议

ChatGPT 会员代充值服务

相关文章

用Midjourney生成图片时，怎么把参考图传上去

Midjourney局部重绘，到底应该怎么用才真正有效

用Midjourney画花卉，到底能画出什么风格？

MJ 画 Logo，怎么才能让它听话

为Midjourney付费的几种方法，以及你可能遇到的坑

用MJ画花卉，其实比你想象的简单，也比你看到的那些教程要有趣得多。这篇文章不会堆砌一堆你看不懂的参数，也不会丢给你一堆模板化的提示词让你照抄。我们聊聊怎么用Midjourney画出你真正想要的花

一次说清，用AI绘画改风格，到底该怎么下手

想要让Midjourney画出的图更有变化？聊聊变体设置怎么用

在Discord上用Midjourney画图，简单几步就搞定

用Midjourney画插画总是模糊，问题到底出在哪

网友评论