此图由MJ v4版本创作
获 视觉中国-爱视觉 AIGC艺术优秀奖
这两天一直在做v5测试,不废话,直接开始。
一:3种参数回归
1、 –tile 无缝拼接。这功能可以让我们更方便制作自己想要的壁纸、底图或连续图案。案例:
Nordic style wallpaper –tile –v 5
无缝拼接后
Watercolor style digital art, colorful, iphone wallpaper –ar 16:9 –tile –v 5
Watercolor style digital art, green element, iphone wallpaper –ar 16:9 –tile –v 5
无缝拼接后
v4版本无缝拼接,需要透过关键词来控制,稳定度比较低,大家也可以试试,教学文章如下:
Midjourney关键词 提升你的创造力之旅 – 工艺美术(上)Midjourney关键词 提升你的创造力之旅 – 工艺美术(下)
给大家一个可以测试无缝拼接的网页,只要把图片拉进去就可以看拼接后的图案。
https://www.pycheung.com/checker/
2、 –ar宽高比率超过2:1。经实测,最大比例到14.222~循环。
我直接做了一张 –ar 1:50 的食物塔,给到的图片是288×4096解析度,这张就不放了,可以测试一下。
放张3:1的漫威超级英雄在清明上河图大战欣赏一下
3、 –iw垫图权重功能回归。可以使用 –iw 0.5 ~ –iw 2 这中间的值作为垫图权重大小调整,数字愈大表示MJ参考底图的比重愈大,不加 –iw 参数,MJ预设值为1。垫图的比例需尽量与底图相同。
垫图方法请参阅公众号文章:AI绘画 Midjourney 垫图技巧说明(垫图篇)
以下用案例进行说明,底图来源为MJ v4版本制作,案例已调整预设为v5,所以后续不再加 –v 5 参数指令
<图片链接> A photo of a girl –ar 2:3 –iw 0.5 / 1 / 2
–iw 0.5
–iw 1–iw 2
我们可以看到权重由小到大的变化,会从欧美女孩到亚洲女孩转化,表示MJ预设的girl为欧美模型,经过参考底图的变化到亚洲模型。
再来将关键词改为漂亮的韩国小姐姐穿泳装在海滩上奔跑试试
<图片链接> A beautiful Korean girl wearing a swimsuit was running on the sunny beach –ar 2:3 –iw 0.5 / 1 / 2
–iw 0.5
–iw 1–iw 2
我们可以看到,关键词固定了韩国小姐姐后,脸型就会以MJ自认的韩国女孩来作为参考,然后跟底图进行混合。而底图权重愈小(左图),关键词在海边奔跑的感觉就会出来,权重愈大(右图)因为参考了底图图像,整个人物构图及风格就较为固定。这也可以作为固定人物图像的一种方式(下)。
二:真实图像照片品质的多方面加强
1、提高预设出图分辨率:
以1:1为例,现在v5四宫格出图为2048×2048像素,选择其中一张图按U后会直接进行裁切出图(1-5秒),不像v4之前版本还要再进行一次重绘,可以省一次GPU重绘的钱。
2、更优的照片质量:
v5照片质量更加强大,并将系统默认改为照片品质,变为更加真实,对某些人而言是优点也是缺点。
A portrait of a cyberpunk geisha android made of porcelain
v4
v5
由图的变化来看,照片的细节及真实感加强了不少,也更贴近我们所描述的语境。
3、加强提示词(关键词):
这次v5加强了照片真实性品质,相对而言就降低了艺术风格,在没有任何风格提示下,系统默认为照片。如果你要的图更像艺术品而不是照片,需要多加一些艺术家或风格流派提示作为引导,并在最后加上参数 –s 。所以对关键词能力要求有所提高。
* –s/–styleize 风格化数字最高为1000。即 –s 0~1000 。数字愈大,艺术风格愈高,将更像艺术图像,反之则更像摄影图像。
A painted in the style of the American artist Andrew Wyeth, with realistic details and a subdued color palette
v4
v5
由图可以看出来v5笔触更偏向写实
4、改进NLP自然语言处理:
与v4不同,v4是尽量以短句分隔MJ更容易理解,v5是以整句的方式会有更好的效果。而针对长句子,有比v4更好的表现范围。
astronaut, floating, outer space –v 5An astronaut floating in outer space –v 5
v5在自然语言句子上,表现更为自然
The scene in the painting depicts a park where people are seen sunbathing, strolling and playing on the grass, A young couple walks hand in hand along a tree-lined path, with smiles on their faces, Some children are playing on the grass, chasing each other, while their parents watch with smiles on their faces, In the distance, some elderly people sit on a bench chatting, enjoying the sunshine and natural scenery, A small dog runs through the crowd, jumping and hopping around, The entire scene exudes a warm, cheerful and lively atmosphere, making people feel the beauty and vitality of life
v4
v5
在一大串的句子上,v5能比v4有更大的表现范围,理解的词语更多,除了写实照片风格外,其他风格表现跟v4对比只能看个人喜好。像我个人就很喜欢v3的粒子感艺术气息。
5、更好的一致性:
*更好的脸、更好的眼睛:portrait of a blonde girl –ar 2:3
v3
v4
v5
各版本有很明显的差距
*更好的牙:
Skull made of gold
v4
v5
可以看到v4的牙齿过密,结构也有问题,v5就比较正常
*更好的手:
A fashionable and beautiful Chinese girl sat at a coffee table by the window, smiling at her beautiful hands
v4
v5
有在公众号学过的同学,一定知道v4要怎么出更好看的漂亮小姐姐,但对于手来说,就是硬伤了,v5完胜。也改进亚洲脸的刻板印象。
*更多的人、更复杂的场景:
very beautiful marie antoinette and handsome louis XIV, in love, lying on a table, top view, all around lots of food, cakes, cupcakes, tea, necklaces, fruits, pearls, very opulent setting, hyperrealistic, photographed with nikon z7
v4
v5
这在v4表现已经算不错了,但需要多跑几次才会出现好图,v5成功表现复杂的场景。
group photo of laughing singer and actor, highly detailed, photorealistice
v4
v5
可以看到v4除了主角之外的人物容易发生变形,v5这个问题就改善许多,牙齿眼神都正常了。
v5在16日上线时,我曾跑了多次测试,在多人关键词表现都还不错,但今天在写公众号时,拿17号跑的3人词再重跑一遍就已经出现鬼图了(3人以上),希望只是暂时的,大家也可以试试是不是有这个问题。
个人总结:
想跑完美照片品质与写实风景,用v5
想做概念设计与风格绘画,用v4
想画抽象画强艺术风格,用v3
想做动漫与二次元,用niji
好了,今天就到这边,喜欢的朋友记的点赞在看或来杯咖啡哦 ^_^