随着AI所生成的图像演变得越来越逼真,似乎“AI不会画手”,已经是AI作品所剩下的最突出的弱点了。
无论是前段时间AI笔下风格各异的二次元美少女;
文中图均源于网络
还是最近AI经过真人图片训练所生成的虚拟妹子;
就好像受到了古神的诅咒一样,在每一位AI生成的美少女姣好面容的背后,都存在着一些瞥一眼就会不断掉san的畸形手指,让人瞬间就失去了想要进一步探索的欲望。
而“AI不会画手”这回事儿,也曾是不少画家们嘲讽AI的谈资——
在此前我所报道过的“画师们在Artstation平台上集体抗议AI入侵”的事件中,“手指”,就是这些抗议的声音中的一个重要的元素。
艺术家们用笔刷画下了这些造型扭曲恶心的手指,用以回击Artstation这一国外最大的艺术平台默许AI入侵的行为。
——不过,AI不会画手的“诅咒”似乎在最近被打破了。
上周,Midjourney 宣布他们推出了第五代版本——Midjourney V5。
和前几次迭代一样,V5在图像质量、风格范围和图片纹理等等都有着一定程度的提升。
但这次大家发现了一个不一样的地方:
AI终于学会画手指了!
使用者发现,在更新V5之后,Midjourney渲染出图像中,人物的手指根根分明,甚至连纹路都栩栩如生,刻画出了岁月的痕迹。
而更新后的AI也会如炫技一般,从不把手指遮遮掩掩地放在身后,而是摆在最显眼的地方,让你根本看不出什么端倪。
不仅如此,如果你执意仔细研究这些AI所生成的手部细节的话,这些图片也并不会让你失望。
更精细的手部细节
在学会画手的同时,使用新版本的大家发现——V5所生成的图像更加高清和逼真,甚至有的到了真假难辨的情况。
相信使用过Midjourney的观众都知道,在此之前,Midjourney生成的图片总体看还是以奇幻风格为主的。
而如今Midjourney V5所生成的图片,已经达到了照片级别的程度。
V5生成的这张AI情侣照片
不仅会画手,新版本在人脸的精细程度上也更上一层楼。
如果谁要在不经意之间拿出这样的图,我想大部分人都会毫不怀疑的认为,这是照相机拍摄的吧。
就在Midjourney V5的推出炸裂全网之后,很快它生成的真假难辨的图片,就引发了一次大规模的社会舆论。
从这周二开始,twitter上就流传着一组“特朗普被逮捕”的图片。
此前特朗普自称正面临刑事指控,可能于本周被捕,而这组图片更是加大了群众的可信度,一时间“特朗普被捕”的消息火遍了全网。
不过很快就有人指出,这组图片其实都是通过新版本的Midjourney生成的。
看来,在突破了手指的限制,拥有更好的图像质量之后,AI似乎真的难以与真实事物区分开来,开始在社会上混淆视听了。
那么,在AI的技术越来越成熟之后,AI真的是时候取代人类了吗?
——先别着急,就现在其他AI的表现来看,现在说“取代”可能还有些早了。
同样是上周,在ChatGPT4推出的一天后,百度在发布会上公布了他们自研的AI工具“文心一言”。
在官方的介绍中,文心一言除了可以提供类似于ChatGPT的对话问答功能外,还支持生成图片、视频等功能。
然而,作为国内第一个对标ChatGPT的AIGC,它的表现却并不是那么优秀。
让人“大跌眼镜”的,主要是在文心一言的“文生图”功能上。
虽说是百度拥有国内最大的中文搜索引擎,但文心一言就好像听不懂中国话一样,只能够理解字面意思,生成让所有中国人瞳孔炸裂的图片——
就比如说,“车水马龙”是什么样的场面?
或许很多人脑内可能已经描绘出一副车马如流水一般的繁华景象——不过在AI的眼里,它所想的,就是这样一个有车、水、龙,但唯独没有马的奇幻场景。
再比如说“胸有成竹”这个成语,大家应该都明白是什么意思吧。
然而在AI精确到每一个字的理解下,这位兄弟的胸上还真的长了根竹子。
或许通过上面两张图片,你已经掌握了文心一言的绘图心得,而在看到下面这张“青梅竹马”,你也就不奇怪了。
可能有的人觉得,对于现代的AI来说,要去理解古人几千年琢磨出来的成语可能有些困难了。
但是,更奇葩的来了——AI对于现代词汇的理解,我感觉还不如成语呢。
来几个食物举例吧。
AI生成的“鱼香肉丝”可真的别有一番风味。
我想密恐人士可能在看到这张图之后,都无法直视这道菜了。
再来上个“红烧狮子头”。
不过吃了这道菜,你接下来可能就要带上一副银手铐了。
如果你还沉浸在被“鱼香肉丝”给震惊到的余韵中,那么下面这道“菜”,绝对能够再一次震撼你的视觉神经——
文心一言是懂夫妻肺片的
好吧,看多了这些稍显诡异的图片,再来看看可爱的小动物们吧。
就比如说这盘“松鼠鳜鱼”……不对啊,这是分明就是松鼠“撅”鱼吧。
虽然理解不了除了字面意思上的其他含义,但文心一言在某些方面还是展现了它强大的学习和模仿能力。
就比如你让它生成一张35岁的资深程序员的画像——
嗯,的确没毛病。
别的不说,在看了这么多“乍一看有点懵,但仔细琢磨还真的挺形象”的图片之后,我只觉得:
用文心一言来玩你画我猜应该挺有意思的。
可以说,这次的文心一言尚不成熟的文生图程序,已经成为了继前段时间简易版图片生成AI软件之后的又一个能够承包一整天笑点的AI乐子。
在百度的文心一言的文生图功能遭到群嘲之后,也有不少人开始质疑:
“从文心一言生成的图片看,它根本就是将中文先翻译成英文,再通过英文输入生成图片的,不会是套了其他AI绘图工具的壳吧。”
在网友们的实践中,能够很明显地看出文心一言将中文翻译成英文的步骤:
就比如说让它画个“起重机”,AI生成了一个完全词不达意的丹顶鹤——
实际上起重机在英文语境中,和鹤共用一个“crane”的单词,所以在这样扭曲的理解下,图片中的工地多了只丹顶鹤。
道理我都懂,为什么这只鹤这么大?
再就是如果你输入“王冰冰”这个人名,生成的也不是本人。AI将中文翻译成了“King”和“Ice”两个单词,于是在图中你就可以看到一位“冰雪国王”。
对于网友们对文心一言套壳造假的质疑,百度在23号给出了回复,表示:
“文心一言的文生图能力来自于文心跨模大模型ERNIE-ViLG。而在训练中我们使用的是全球互联网公开数据,符合行业惯例。”
也就是说,文心一言确实把输入的中文句子,通过机器翻译生成了单词。
但这并不是网友们口中说的“套壳”,而是因为目前开源的图文数据大部分为英文内容。
百度的画图AI采用了应为标注的开源图片素材进行训练,而这样的训练需要将提示词中翻英,这才导致了上面这些“图不达意”的图片产生。
在文心一言闹了个大笑话之后,百度表示:
“文心一言正在大家的使用过程中不断学习和成长,也请大家给自研技术一些信心和时间。”希望在不久之后,我们能够看到文心一言全新的面孔。
在我看来,在AI不断突破人类上限的技术冲击下,像百度这样抢先加入研究AI的行列的方式也是无可厚非的。
只不过,可能还要再给文心一言一些时间吧。
事实上,如果你也关注AI这方面的新闻的话,你会发现——
最近这段时日,有太多厂商都开始争先恐后地将AI技术纳入自己的发展目标了:
3月22日,无数美工、设计师的生产力工具Adobe,也在前几日宣布加入AI的战局。
在Adobe Summit用户大会上,Adobe发布了“Adobe Firefly”的私人测试版AI工具,利用这个工具,仅仅输入文字,就可以协助创造者完成图像生成、模型构建、图像编辑以及图形变体等各种任务。
Adobe Firefly强大的“涂鸦成画”功能
除了设计领域,游戏行业也没有落后追随AI的脚步。
3月23日,育碧发布了一款新的人工智能工具“Ubisoft Ghostwriter”,并且生成这款AI将用于生成触发NPC台词和周围群众聊天内容的初稿。
育碧表示AI工具的诞生能够让开发团队腾出更多的时间,来处理更为重要的元素:“Ghostwriter 是与叙事团队共同创建的,旨在帮助他们更快更有效地完成重复性任务,让他们有更多时间和自由去处理游戏的叙事、角色和剧情。”
在3月21日晚,英伟达的第14次GTC大会上,英伟达的创始人黄仁勋就发表了一段长达78分钟的演讲《切勿错过AI的决定性时刻》。
在演讲时,他多次强调——“AI已进入iPhone时刻”。
可以预见的是,随着AI渗透到各个领域,AI技术带来的工作形式的转变,将会影响到各行各业。
这两天一直挂在小红书热搜上的,就是有关AI颠覆职业的内容。
随着AI生成图像的精度提升,将图片中的服装转移到AI模特的“一键换装”功能正在成为了讨论的热点。
从生成的图片来看,AI模特身上的衣服效果和原图并没什么大的区别,甚至还能够自由变换想要的姿势。
真人模特(左) AI模特(右)
对于店家来说,AI模特的诞生能够给他们带来更多的便利。不仅仅是省钱,还能够提高效率,这样一键生成的方式能够让他们随时随地的上架新的的产品。
然而,如果AI模特真的得到广泛应用,我想不止是会影响到模特的行业,对摄影师、化妆师以及场地租赁人员等等行业来说,都会带来不小的冲击。
虽然我不确定AI是否能完全替代这些创造型的工作,但我知道,随着AI渗透到各行各业,一个全面应用AI的时代已经逐渐到来。
也许目前AI仍未波及到所有的行业,但如果不想被AI所取代的话,我想每个人都要做好“驾驭”它的准备了。