温馨提示:在 ChatGPT 官网(www.chatgpt.com)使用 GPT-5.5、ChatGPT-Image-2 等模型时,需要 ChatGPT Plus 或更高等级的会员权限。如需购买账号或充值会员,请扫码添加我们客服咨询。
**Midjourney 中文关键词撰写摘要** ,用Midjourney生成高质量图像,中文关键词的写法关键在于“结构清晰、描述精准”,基础公式为:主体描述 + 风格/技法 + 光影氛围 + 参数,主体要具体,避免模糊词汇;风格词如“赛博朋克”、“水墨”或“宫崎骏”能明确视觉方向;加入“电影级光照”、“体积光”、“景深”等光影词能瞬间提升质感;最后用“--ar 16:9”等参数控制画幅,进阶可融合艺术流派或设计师名,如“草间弥生风格”,并善用“极致细节”、“8K”等提升画质的词,核心是让AI准确理解你的视觉意图。
你打开 Midjourney,想到一个画面,一个在月光下弹古筝的女孩”,可输入进去,出来的图怎么看怎么别扭,可能古筝变成了奇怪的木盒子,月亮也糊成了一团光,这不是你的想象力不够,而是 Midjourney 没真正读懂你的中文。
虽然 Midjourney 现在能理解一些中文,但它骨子里还是个英语工具,它接受的训练数据、内部的提示词处理逻辑,绝大部分还是英文,也就是说,你用中文描述的画面,它要先在内部转换成自己能理解的概念,这一步很容易丢掉细节、氛围,甚至搞错物体,想稳定地创作出好看的作品,最直接的办法就是学会自己调整关键词,让你的中文想法准确地传达到 AI 那里。
围绕一个中文想法,到底怎么创作出能用的提示词?下面我把这个过程拆开讲,每一步都配上例子,你跟着走一遍,很快就能找到感觉。
第一步,把你的想法拆成几个固定的部分。
不管画面多复杂,你都可以先把它分成几块,最常用的组合就是:主体 + 环境 + 动作 + 风格/氛围 + 技术参数。
比如你想画“雨夜里,一个穿汉服的女孩撑着油纸伞站在石桥上”,你可以这样拆:
- 主体:穿汉服的女孩
- 环境:雨夜,石桥
- 动作:撑着油纸伞,站着
- 风格/氛围:安静,电影感的光线
- 技术参数:画面比例,模型版本等
这样拆开之后,你就不是扔给它一整个长句子让它猜,而是让它分别理解每一块内容,这个思路能解决大部分“画面乱、元素错”的麻烦。
第二步,把关键词块转成英文。
因为 Midjourney 对英文的反应最准,所以拆好之后,下一步就是把这些词块转成英文,你不用自己翻译,随便用一个翻译工具就行,DeepL、谷歌翻译、甚至手机自带的翻译软件都可以。
上面那个例子翻译过来大概就是这样:
- a girl wearing Hanfu
- standing on a stone bridge
- holding an oil-paper umbrella
- rainy night
- cinematic lighting, calm atmosphere
这些词块就是你的核心素材,就是怎么把它们组合得更好看。
第三步,给描述加上“质感”和“风格”的词。
这是很多第一次用 Midjourney 的人会卡住的地方,光说“一个女孩在桥上”,AI 可以给你无数种画法,可能是简笔画,也可能是油画,你不告诉它要哪种风格,它就自己随便选,结果经常和你想的差很远。
你要学会加一些描述风格和质感的词,这些词本身也是英文的,但用起来并不复杂,你当成固定搭配记几个就行。
常用的有这几类:
- 画面风格:photorealistic(像照片一样真实), oil painting(油画), ink wash painting(水墨画), illustration(插画风格)
- 光影氛围:soft lighting(柔和光线), dramatic lighting(戏剧化光线), neon lighting(霓虹灯光), golden hour(黄金时刻的光)
- 细节质量:highly detailed(细节丰富), 8k, octane render, unreal engine 5(后面这些是高质量渲染词)
- 艺术家风格:by Hayao Miyazaki(宫崎骏风格), by Makoto Shinkai(新海诚风格), by Zhang Daqian(张大千风格)
加到刚才的词块后面,效果就完全不一样了,比如你加一些电影感的光线:
a girl wearing Hanfu, standing on a stone bridge, holding an oil-paper umbrella, rainy night, cinematic lighting, calm atmosphere --ar 16:9
这样出来的图,氛围就会稳很多,不会随机乱跳。
第四步,用好参数,尤其是长宽比和模型选择。
参数是关键词里很实用但容易被忽视的一部分,最常用的就两个。
一个是画面比例:--ar。--ar 16:9 是电影宽幅,--ar 3:4 适合人物特写,--ar 1:1 是正方形,你想好画面用在哪里,就用对应的比例,Midjourney 默认是正方形,这会让很多开阔的场景显得很挤,所以记得改。
另一个是模型版本,Midjourney V6 对自然语言的理解力比之前版本好了很多,你写的描述越长,它处理得越顺,如果你用的是 V5.2 或者更早版本,那种简短的、用逗号隔开的“咒语式”写法可能更管用,但如果你现在用 V6 或更新的版本,你完全可以写更自然的描述语句,它读得懂。
在提示词末尾加上 --v 6 就能切换到 V6 版本,如果你不确定自己用的是哪个,默认大概率已经是 V6 了,但写上更稳妥。
第五步,一些很容易被忽略的中文细节问题。
你在用中文想画面的时候,有些词很抽象,唯美”、“有感觉”、“空灵”,这些词直接翻译成英文扔给 Midjourney,它多半是不懂你要什么的。
遇到这种词,你就需要把它转化成它能理解的画面元素。“唯美”可以是 soft lighting, pastel colors, dreamy atmosphere;“空灵”可以是 mist, ethereal light, floating particles,把感觉翻译成光线、颜色和物,这样就能解决很多说不清楚的风格问题。
另外还有一个点是文化元素的准确表达。“汉服”你写 Hanfu 它基本能认,但再细一点,比如某种纹样、某种头饰,Midjourney 训练的图片可能不够,它就会用相近的东西来凑,结果就出错了,这时候可以补充一些更通用的描述,traditional Chinese hairpin with jade”就比直接翻译一个生僻名次要稳。
第六步,试试用图片加文字的方式。
到了这一步,你可能会发现有些感觉真的很难用文字说清楚,就算翻译了也有偏差,这时候就不要硬写,可以试试 Midjourney 的图生图功能。
你可以找一张网上看到的、氛围接近你想要的图片,把它的链接放在关键词前面,然后再加上你的描述,这样 Midjourney 会参考那张图的构图、色调和整体气质,再结合你写的词来画。
举个例子,你看到一张光影很好的古风摄影,但你不想画那个人,你可以上传那张图,然后把链接放前面,后面写:
[图片链接] a girl wearing Hanfu, standing on a stone bridge, holding an oil-paper umbrella, rainy night --iw 0.8
这里的 --iw 就是图片权重,数值在 0.5 到 2 之间,越接近 2,就越像原图;越接近 0.5,就越只参考一点感觉,你根据自己的需要调就行。
这一招很适合那些“说不清楚但一看就知道”的风格模仿,比自己硬憋词语要快得多。
把整个过程连起来看一遍。
我们来完整走一遍,就从你脑袋里的一个中文想法开始。
你想到:“雪中古寺,一个僧人正在扫地,画面安静,有点像老照片。”
第一步,拆块:
- 主体:僧人
- 动作:扫地
- 环境:雪中古寺
- 风格:安静,老照片质感
第二步,英文翻译:
- a Buddhist monk
- sweeping the ground
- in front of an ancient temple in snow
- quiet atmosphere, vintage photo style
第三步,加风格质感和参数: a Buddhist monk sweeping the ground, in front of an ancient temple in snow, quiet atmosphere, vintage photo style, soft light, film grain, 8k --ar 4:5 --v 6
这样一个关键词,出来的画面基本会符合你的预期,如果某个元素不够明显,你就把那个词的描述再加重一点,比如把“snow”扩展成“heavy snow falling, snow-covered ground”。
你看,这个过程完全不神秘,就是一步步把你的中文想法整理清楚,变成 Midjourney 习惯接收的指令,这样一来,它不再是瞎猜,而是在执行你的具体要求。
如果遇到瓶颈怎么办。
有时候你反复调整,图还是不理想,这个情况很正常,可能出在两个地方。
一个是词和词之间抢戏了,你给的信息太多,每一样都想突出,结果 AI 每样都放一点,反而乱七八糟,这时候你要做减法,把最重要的三个点抓住,其他的先删掉,出来稳定的构图后,再慢慢加回细节。
另一个原因是有些视觉风格,Midjourney 目前的训练数据就是不够扎实,尤其是一些比较冷门的中国传统文化元素,这时,就不像写提示词的问题,而是工具本身的素材就有上限,遇到这种情况,参考图会比纯文字管用很多,你也可以直接用“describe”指令,把参考图喂给 Midjourney,看它会用什么英文词描述那张图,然后借鉴它给出的词来调整你的提示词,这招特别实用。
最后的一点提醒。
很多朋友在 Midjourney 使用过程中,不仅会遇到创作关键词怎么写的问题,还会遇到账号怎么注册、会员怎么买、续费怎么操作这些琐碎的事,尤其是现在各种充值渠道复杂,有些代充服务不太稳定,容易耽误正常使用,如果你在 ChatGPT、Claude、Midjourney、Gemini、Cursor、Suno、API 中转以及各种 AI 工具的使用和资讯方面有疑问,或者在买账号、续会员、找充值这些环节上拿不准,本站提供咨询服务,你可以扫描页面底部的二维码联系我们,我们会尽力帮你找到合适的解决办法。
把上面说的这六步用熟,你就不会再觉得 Midjourney 难控制了,创作的关键不是你会多少生僻的咒语,而是你能不能稳定地把心里的画面讲清楚,这个思路一旦建立起来,你之后不管画什么,都会有清晰的操作路径。
温馨提示:在 ChatGPT 官网(www.chatgpt.com)使用 GPT-5.5、ChatGPT-Image-2 等模型时,需要 ChatGPT Plus 或更高等级的会员权限。如需购买账号或充值会员,请扫码添加我们客服咨询。

网友评论