周六,AI图像服务Midjourney开始对其文本到图像合成模型的第4版(“v4”)进行alpha测试,该模型可供其Discord服务器上的订户使用。新模型提供了比以前在服务上提供的更多细节,激发了一些AI艺术家评论说,v4几乎使从简单的提示中获得高质量结果变得“太容易了”。
Midjourney于3月向公众开放,作为早期AI图像合成模型浪潮的一部分。由于其独特的风格以及在DALL-E和稳定扩散之前公开可用,它迅速获得了大量追随者。不久之后,Midjourney制作的艺术品通过赢得艺术比赛,为潜在的历史性版权注册提供材料,并出现在库存插图网站上(后来被禁止)而成为新闻。
随着时间的发展,Midjourney通过更多的培训,新功能和更多的细节来完善其模型。当前的默认模型称为“v3”,于 8 月首次亮相。现在,Midjourney v4 正在接受该服务 Discord 服务器的数千名成员的测试,这些成员通过 Midjourney 机器人创建图像。用户目前可以通过在提示符后附加“–v 4”来试用 v4。
“V4是一个全新的代码库和全新的AI架构,”Midjourney创始人David Holz在公告中写道。“这是我们第一个在新的中途AI超级集群上训练的模型,并且已经工作了9个多月。
根据Holz的说法,v4的其他功能包括:更多的知识(关于生物,地点等)- 更好地处理小细节(在所有情况下)- 处理更复杂的提示(具有多个细节级别)- 更好地处理多对象/多角色场景- 支持图像提示和多提示等高级功能- 支持chaos arg(从0到100设置)来控制各种图像网格。
在该服务的Discord上,对Midjourney v4的反应是积极的,其他图像合成模型的粉丝 – 他们经常与复杂的提示反驳以获得良好的结果。
一位名叫Jon Bristow的Redditor在r/StableDiffusion社区发帖说:“还有人觉得Midjourney v4太简单了吗?这是“脸部特写摄影”,感觉就像你没有成功一样。就像是预制的一样。作为回应,有人开玩笑说:“为专业提示者感到难过,他们将失去一个月前创造的新工作。
Midjourney表示,v4仍处于alpha阶段,因此随着时间的推移,它将继续修复新模型的怪癖。该公司计划提高v4放大图像的分辨率和质量,添加自定义纵横比(如v3),提高图像清晰度并减少文本伪影。Midjourney的月服务费在10美元到50美元之间。
考虑到Midjourney在八个多月的工作中取得的进展,我们想知道明年图像合成的进展将带来什么惊喜。