在过去的几年里,人工智能取得了极快的发展,其中包括基于机器学习和深度学习的「图像生成技术」。运用该技术,只需输入文本语句就可输出具有独特风格和想象力的图像。面对AI绘图这个势不可挡的趋势,设计从业者们,是否做好准备了呢?
在过去的几年里,人工智能(AI)取得了极快的发展。
ChatGPT和GPT-4对话上的智能程度在不断刷新常人的认知,给大众带来了惊人的体验与惊叹。
同期发展的AI技术,还有基于机器学习和深度学习的「图像生成技术」。
该技术能够让计算机在一定程度上模拟人类进行绘画,用户只需输入文本语句(prompt提示)就可输出具有独特风格和想象力的图像。
文本->图像,AI绘图,指的就是这个过程。
随着大众对于AI绘图关注度的升温,相关的争议不断,有人开始提出「AI取代画师」的观点。
面对AI绘图这个势不可挡的趋势,设计从业者们,是否做好了准备?
一、AI绘图,高效无情的出图机器
2022年8月,在美国科罗拉多州艺术博览会上一幅名为《太空歌剧院》的画作在数字艺术类别比赛中获得了第一。
由AI绘制的《太空歌剧院》
人们也很快得知,这个画作并非真人绘制,而是由游戏设计师使用一个叫Midjourney的AI工具生成而来。
随着这则新闻的传播,AI绘画也开始进入更多人的视野。
1. 国外知名的AI绘画工具
下面先介绍几个国外具有代表性的AI绘画工具:
1)DALL·E2
DALL·E2 是一个由 OpenAI 公司开发的模型,也是一个在线服务。它通过输入一个文本描述(prompt提示)生成多个精准匹配文本的图像。
DALL·E2 结合”CLIP 预训练模型”和”Diffusion扩散模型”来实现了文本->图像(text-to-image)的生成。
扩散模型运行时的成像过程,就是一个”Diffusion 扩散”的过程——
从有噪声开始->逐渐改善图像->直到完全没有噪声->图像越来越接近所提供的文本描述。
DALL·E2 还有一个的特别的功能是”AI编辑”,可以在生成的图片上涂抹某些部分再让 AI 直接修改。
DALL·E2 只使用了已获授权的图片集来进行训练。
2)Stable Diffusion
Stable Diffusion 模型,前身是谷歌开源的 Disco Diffusion 模型。
Stable Diffusion 模型也结合了CLIP技术(OpenAI发布的技术)和Diffusion扩散模型,同样是通过输入文本(prompt提示)来生成图像。
比较特别的是, Stable Diffusion 是一个开源的模型,很多开发者基于这个开源模型开发训练出了更多不同的生成模型。
Stable Diffusion 的母公司Stability AI 在2022年10月宣布获得1.01亿美元融资,投后估值达10亿美元。
3)Midjourney
Midjourney由同名实验室开发,和大部分市面上的AI绘画应用采用的是同一个模型,但是模型使用了大量图像数据来训练。
Midjourney在生成图片的一致性和连贯性上做了很多努力,它生成的图像风格十分独特。
Midjourney几乎所有的生成和交互都发生在Discord社区里,使用其Discord机器人来接收请求和发送生成结果。
3种绘图工具的对比:我们进行测试,对于同样一句文本(其他参数默认的情况下),这3种绘图工具的图片生成效果。
输入文本:
An old man rowing a boat on a lake.
AI生成的图片:
收费标准:
3种绘图工具的体验地址:
①Stable Diffusion
Dream Studio:https://beta.dreamstudio.ai/dream
Hugging Face(免费): https://huggingface.co/spaces/stabilityai/stable-diffusion
②DALL·E2
https://openai.com/dall-e-2/
CLIP:https://openai.com/blog/clip/
③Midjourney
https://www.midjourney.com/home/
(注:某些服务只对部分国家开放)
Midjourney的效果更具艺术感:
对比生成效果可以明显看出,Midjourney生成的图像不太像照片,似乎更像一幅艺术画作。
在Discord社区里运作的Midjourney社区 ,因为其具有艺术感且画面注重细节的生成效果,收获了全球近千万用户,在线用户也是百万等级。
在社区频道里,用户仅仅需要使用/唤起命令行操作,在/imagine命令下输入prompt文本发送即可。
以下是输入简单文本后,Midjourney生成的图像:
效果如此惊艳的生成图片,只需几十秒内就能得到。
2. 国内的AI绘画产品
国内也相继出现了类似的AI绘画产品,几乎都有免费尝试的额度,通常支持多种风格/艺术家/模型。
以下是国内提供AI绘画服务的一些产品:
随着技术的逐渐普及和越来越高的热度,AIGC似乎就不再是大众试水画图画着玩儿的一个小工具。
这个”高效无情的出图机器”,似乎已经开始在影响和撬动设计行业的变革。
二、设计行业 X AIGC
1. 游戏制作× AIGC
很多游戏项目,开始利用AIGC生产游戏相关素材。
1)国外游戏工作室 Lost Lore《Bearverse》游戏
国外游戏工作室 Lost Lore 出品的主打 NFT 集换概念的F2P游戏《Bearverse》包含了大量的角色设计。
游戏工作室直言:采用AI画图节省了80%美术成本!
①17名角色的调整:
开发成本:从5万美元压缩至1万美元;
工时耗费:从6个月大幅减少至1个月。
②创作一张场景概念图:
工时耗费:从1-2周压缩至1天以内。
设计总监最后也坦言:
95%的效果和概念图呈现仍是由团队真人创作。
2. 商业设计 ×AIGC
大厂团队已经不甘观望,开始了AIGC在商业设计工作流中的实践。
1)腾讯-ISUX团队
腾讯的ISUX团队2023年3月1日刚刚发表在其官网的文章《运用AIGC人工智能生产内容》
https://isux.tencent.com/articles/aigc-design.html
文中提到了腾讯的ISUX团队运用AIGC进行商业设计的好几个案例,并进行了结合使用AIGC后设计团队的全新工作流的方法总结。
2)百度-AIGC营销赋能业务
百度也在试图利用AIGC满足商业设计上的需求。
百度发布了AIGC方向的产品负责人岗位,负责比如”商业广告平台部的内容生产相关工具的规划和落地”。
3. 个人头像设计× AIGC
1)国外的AI美图软件Lensa「魔法头像」功能
「魔法头像」是Lensa基于Stable Diffusion技术开发的头像生成功能,用户上传10-20张自拍照,能生成50~200张不同风格的AI自画像/头像。
生成50/100/200张的价格分别是:3.99/5.99/7.99 美元。
因为这项新功能的加入,2022年12月的前5天,Lensa下载量达到400多万次,”日收入”也一度达到了300万美元。
2)美图秀秀「百变 AI 头像 」功能
同样是美图软件的国内团队——美图秀秀,也随机发布了相似的功能。
从产品定位来看,也是输入真人头像就能批量地获得多种风格的头像。
和国外的AI美图软件Lensa相比,美图秀秀对于用户的输入门槛要求更低一些,只需要提供3张正脸无遮挡自拍照即可。
3)抖音「AI绘画」特效
继2021年的「漫画脸」特效(基于GAN技术)后,2022年抖音又上线了特效玩法「AI绘画」(基于Stable Diffusion技术)。
用户只要输入一张图片,AI就会根据图片生成一张动漫风格的图片。
抖音「AI绘画」功能的的峰值QPS(每秒请求量)一度达到1.4w。
4)QQ小世界AI画匠
腾讯QQ上线了”QQ小世界AI画匠”活动,主题为”异次元的我”。
用户上传1张个人照片,即可一键生成专属异次元形象。
4. 动画背景× AIGC
1)国产志怪类动画《神弦曲:猫儿与时光铃铛》
由十九号动漫出品的国产志怪类动画《神弦曲:猫儿与时光铃铛》将于明年上映。官方在2022年12月发布了预告片。
主创团队称,预告片三分之二的背景都是结合AI制作完成的。
制作预告片中的30多个背景,工时耗费从3个月降到2个月,效率上提升了至少30%。
主创在采访中提到:”有了这样的一个技术,把我们的预算从一个标准动画电影预算直接减半,我们就快速地获得了一些投资机会。”
5. 视频制作× AIGC
除了绘画领域外,AIGC也在动态的视频生成上有了很多突破。
1)Runway 新功能:视频转风格生成器 GEN 1
Runway AI 是一家图片和视频AI编辑软件提供商,为设计师、艺术家和开发人员提供一系列工具的平台,帮助他们利用人工智能技术创建作品。
Runway 平台推出了新功能 —— 把视频转换成任意风格的生成器 GEN 1。
GEN 1 这个能力和图生图功能(image-to-image)类似,只是变成了从视频到视频(video-to-video)的生成。
https://research.runwayml.com/gen1
看起来, GEN 1 是一个支持用户可订制化的视频滤镜的能力。
而定制化的方式极为简单,只需一张具有风格的图片。
2)Wonder Studio:一键替换真人为CG角色
这款由一家人工智能初创公司Wonder Dynamics推出的AI工具Wonder Studio,声称可以实现「一键把视频中的真人替换为CG角色」,简化电影制作流程。
https://wonderdynamics.com/
整个工具的使用流程大概是:
真人先替代CG机器人进行表演
视频拍摄完成,导入进软件
选择想要的CG角色,安装在实拍的真人身上
目前官方网站上开放了内测申请。
三、AI绘图的争议
在设计行业中,很多人的对于AI绘图的态度,都是不怎么正面的,主要集中在几点:
从业者的担忧
版权
学习信心的打击
争议1:从业者的担忧
在AIGC生成绘画能力效率和质量皆可的前提下,中底层画师好像确实慢慢就不需要那么多了……
论出图速度:人赶不上机器的出图速度;
论出图创意:AI 可以生成出关键元素外的细节,似乎更为惊喜;
论风格效果:AI 能训练出不同的绘画模型,对应不同画风;
输入相同的一段prompt文本后,不同的模型可以生成出不同风格的图片,且速度极快,通常是几秒~20秒内不等:
除了想要的关键元素外,生成图片中还包含更多精彩的细节描绘。
结合AI批量生成的能力,很多绘画需求,似乎只靠AI就都被高效地满足了。
随着AI作画的部署成本逐渐降低,一些中小企业和初创团队,也开始有能力在通用大模型的基础上进行模型的调教、设计师岗位的精减。
令从业者最担心的事情就是:
当AI绘画工具具备了一定绘画能力,也就同时具备了”抢人类设计师饭碗”的能力。
争议2:版权
我们在AI绘画出的作品中能看到很多有明显风格的影子。
也可以直白地说,一些AI绘画模型的训练数据中,有着很多未经明确授权的画师作品。
AI绘画侵犯了画师的版权,也开始遭到画师们的集体抵制。
2022年8月29日,一个名叫mimic的AI绘画网站上线了测试版,主攻日系二次元画风头像,允许用户上传15-200张图像让AI学习并输出相同画风的AI画作。没想到刚发布便遭到大量日本画师的抵制,画师们集体发表了”禁止将我的作品用于AI作画”的声明。有的画师为了防范于未然,甚至删除了发在推特上的画作,怕有心之人盗用上传至平台使用。
2022年12月,全球知名CG视觉艺术网站 Art Station也被上千名画师发起了联合抵制,画师们认为,任由系统学习模仿自己的画作是在侵犯版权。网站画师纷纷上传一张名为”NO TO AI GENERATED IMAGES(拒绝AI绘画)”的图片表明态度,首页一度被此图片占领。
对于画师们来说:
自己的画风,是独属于自己的独特标志和可贵财产。
如果让AI简单地模仿自己画风来作画,那无疑是对独有艺术的糟蹋。
即便有的画师愿意提供自己的绘画作为模型的训练数据,但似乎他/她们也没有收到任何版权上的收益。
AIGC产出的画作的版权归属于谁,成了关注和争议的话题。
争议3:打击小白学绘画的信心
AI 绘画的强势碾压的能力,似乎也打击到了不少绘画小白从零开始学绘画的信心。
有的人会感叹:
既然AI几天就能学到做到那么好的效果了,自己再花费数年去学习,还有没有必要…
四、AI 绘图的短板
AI绘画当然不是全能的,也永远不会是。至今的AI绘画也还存在着众多短板。
短板1:AI 无法准确还原想象中的创意
AI绘画的确具有非常强大的创造力和想象力。但这样的创造力和想象力,其实是一种「快速随机」的结果。
效果既受限于算法、数据的质量和数量,也受限于用户对于prompt的运用。
人类的创造力和想象力仍然具有独特的价值,想要AI生成还原出来十分贴合人脑想象中的创意,是很有难度的。
不少尝试了MidJourney进行AI绘图的人表示:
AI生成的图片效果确实是不错,但都并不是我脑海中想象的那个样子。
甚至,AI会理解失误,生成”离谱图片”:
输入的文本是:一个小女孩,一手拿着冰淇淋,一手牵着气球,走在公园里。
AI生成出的却是——”冰淇淋气球”。
短板2:AI 绘图还不足够满足个性化需求
AI 绘图是很强,但是还不足以满足个性化需求。比如:
针对不同场景类型进行统一且又独具个性的设计;
稳定一个主体使之在每一次生成结果中都保持成套效果;
以上能力的欠缺,使得AI无法高效地完成”成系列的商业设计”。
五、AI绘画的未来
尽管很多设计从业者对于AI绘画表示焦虑,但作者判断:未来很长一段时间内,大部分行业可能只会把AI绘画当成一个「辅助工具」来用。
前期,大家在拼AI的效率;后期,则是拼人工优化AI的能力。
人工优化AI能力,可以从以下3个方向出发。
优化AI方向1:AI 模型的定制
想要模型更稳定地产出特定风格的绘画图片,可以定制出一个AI模型。
但AI模型的定制的门槛比较高,通常至少需要一个设计师搭配一个算法工程师来实现,而涉及到模型训练的过程,则需要工程部署能力、硬件显卡的支持。
模型训练出的效果也取决于多个因素,比如:训练素材、模型选型、参数设置、训练方法等。
优化AI方向2:会用 prompt “咒语”
我们可以把”prompt”理解为”送给AI模型的文本指令”。
输入高质量有效的prompt,可以大幅度提升AI绘图的稳定度,让成图更加接近我们的描述。
prompt输入的格式通常可以是以下内容的一个组合:
prompt文本输入=[形容词+主语 / 主语+状语],[背景],[画面类型],[风格/艺术家],[灯光/色调],[视角/修饰词],[细节],[画面质量]
因为这一体验过于神奇,很多人不禁将prompt形容为”咒语”。
在市场上,还出现了买卖prompt词的平台:一家初创公司PromptBase,允许用户在该平台买卖提示词(Prompt),售价约为1.99美元~9.99美元不等。PromptBase将向卖家抽成20%。
平台上目前已上架不少提示词,适合不同模型、不同种类。
而在学术上,也有所谓”prompt engineering” 即” prompt 工程”的说法。
提示工程(prompt engineering):如何同人工智能交流,并得到你要的结果。
https://learnprompting.org/docs/intro
优化AI方向3:灵活组合模型,优化工作流
因为AI绘画工具的介入,现有设计的工作流程将随之而改变,整合诞生了全新的工作流:
AI绘画先进行生成-> 再从AI生成的十几张结果中挑选用作局部素材->再利用PS或其他工具精修处理
随着AI绘画相关的新技术不断出现,其AI绘画的工作流也需要随着新的技术来优化,进化为更适合的工作流。
比如,当发现了「根据图片提取prompt」的新技术后,可结合这个新技术优化设计工作流。
结合了「提取prompt」的设计工作流,也许就变成了这样:
再比如,当发现了出现「ControlNet插件」的新技术后,可结合这个新技术再次优化设计工作流。
ControlNet插件:可以完成对人物骨骼走势、形态、动作、姿势的精确控制。
结合了「ControlNet插件」OpenPose模块的设计工作流,也许就变成了这样:
以上提到的”人工优化AI能力”,第1点”AI模型定制”门槛较高,需要一定技术和硬件。
但”prompt实践”、”设计流程优化”,都是现今设计从业者可以探索和实践的方式。
六、画师的命运:等着被取代,还是转型?
我们经常看到一些新的AI技术应用的效果出现后,很多人立马开始感叹:AI抢饭碗了、AI取代设计师、失业倒计时+1……
AI绘画的能力不容忽视,但它也不是万能的。
AI解决了生成效率,能在一定流程上减少一部分工作量。但又因为AI绘画引入了新的工作流,同时会创造新的工作量。
相应地,一些新的就业岗位也会增加,比如现在就有俗称为”AI调教师”的一种存在。
在某些绘画领域中,也已经有了”AI插图绘制师”、”AI绘图师”的人力需求:
以下,也许是”AI绘图师”可以贡献的能力:
绘制优质的训练素材供模型学习
高效地使用prompt,测试出稳定的生成效果
将”生成结果的质量好坏”准确地反馈给算法(人类反馈强化学习RLHF)
结合AI技术,优化设计工作流
AIGC势不可挡,那些率先学习如何用AI进行美术工作的人,将会发现自己处于行业的顶端。
毕竟,差异化竞争的关键,就是让自己掌握”差异化的优势”。
截图源自Aisocia.com平台的AI对话
结语
借用一段”腾讯ISUX团队”文章中的结语:
随着AI模型能力的飞速迭代升级,现有的短板能力也会不断补齐,因此我们可以相信在不远的将来,设计师利用AI模型来开脑洞并辅助出图是趋势所向,但并不是说我们需要完全依赖AI,因为设计本身是理性而浪漫的工作,仅靠随机性做设计是完全不可取且不靠谱的。更合适的思路应该是,设计师首先定义好规则与框架,从AI模型提供的成百上千个结果中寻找到最匹配我们诉求的结果,从而辅助我们更快更好的达成目标。另外面对日新月异的的智能工具,我们应该保持终生学习的心态,做好时刻接受新事物的挑战,才能在越来越激烈的竞争中立于不败之地。——《运用AIGC人工智能生产内容》
AI绘画,还仅仅是AI技术应用的其中一环。未来,AI将涉足3D模型生成、AI视频创作、AI作曲等领域。
更多AI能力也会发展,就像现在的AI绘画一样,影响和撬动相关行业的变革。
AI绘图会取代所有画师吗?不可能。
AI绘图会逐渐取代中底层画师吗?不无可能。
留给从业者的忠告,还是那句话:保持终生学习的心态,做好时刻接受新事物的挑战。
最后,送给所有打工人的心声:
参考文章:
https://www.marktechpost.com/2022/11/14/how-do-dall%C2%B7e-2-stable-diffusion-and-midjourney-work/ How Do DALL·E 2, Stable Diffusion, and Midjourney Work?
https://www.thepaper.cn/newsDetail_forward_21420325
https://finance.sina.com.cn/blockchain/2023-03-03/doc-imyiqhat7670720.shtml
https://baijiahao.baidu.com/s?id=1759154697131925527
https://mp.weixin.qq.com/s/pkzXaW_-77zXLKQqx2nlcA
作者:葛晓玲,一个互联网重度依赖者。微信公众号:产品零感(feelingPM)
本文由 @葛零零 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
查看原文