AI日新月异!ChatGPT、文心一言、Midjourney各显神通

MJ指南2年前 (2023)发布 一起用AI
629 0 0

整理自 | CG世界、DRock、APPSO

阅 | 010-86092062

AI是当下最热门话题之一,其以飞快地速度侵袭各行业领域。虽然不少人都对AI产生抗拒心理,但其更新换代升级的速度令人咋舌,即使不使用也需要关注和了解以免跟不上改变生活的这股“潮流”,那么一起来看下近期行业内AI新动向吧。

1

ChatGPT 4发布

3月15日,OpenAI 宣布推出 ChatGPT 4.0,ChatGPT Plus 用户在当天就能体验到。OpenAI 称它是“最先进的系统,能生产更安全和更有用的回复”

和上一代相比,GPT-4 拥有了更广的知识面和更强的解决问题能力,在创意、视觉输入和长内容上表现都更好了。用在创意项目上,它能帮助用户一起创作歌曲、编写剧本或者学习用户的写作风格。

用 A-Z 开头的单词组成一段话,解释灰姑娘的故事

处理长内容上,GPT-4 能处理长至 2.5 万字的文本。把链接丢给它,然后就能让它根据文本分析和提取。

值得注意的是,GPT-4 可以直接读取 3.2 万个 token,相当于给它 25000 英文字的背景信息,就可以快速给出结论

而上一个版本只能读取 4096 个token,相当于3000 英文字信息,这个版本的进步是跨越式的。除了文本以外,你还能把图片作为输入内容给 GPT-4,它不仅能够识别出图中的物件,还能根据这些信息进一步处理内容

据 OpenAI 介绍,GPT-4 展示了「在多种专业和学术指标下展现了人类水平的表现」:类似于手机的跑分软件,在 ChatGPT 刚出来的时候,也有不少人用它「刷题跑分」,在 GPT-3.5 版本模型下,它的 SAT 成绩只能排倒数 10% 的水平,然而 GPT-4 模型可以超越 90% 考生的水平。

更重要的是,Open AI 还说 GPT 4 比之前模型都更安全了。在 OpenAI 的内部测试中,GPT 4 被“骗‘到回复出不当答案的几率下降了 82%,聊起敏感话题时(如医疗),它的回复合规性也提高了 29%。不过,OpenAI 也承认,即便如此,GPT-4 在“社会偏见、幻觉和对抗性提示”上仍存在限制

最近有一家名为TREE Industries的开发公司展示了几段视频,内容是利用OpenAI推出的多模式模型GPT-4控制UE5中灯光的展示。

这里直接告诉AI:“create 3 point light in a row”(在一行中创建3个点光源),然后稍等会就直接按命令生成了。不仅如此,我们还可以控制灯光的随机颜色。

还可以删除某一个灯光。

据了解TREE Industries是一家专门开发AI/ML驱动的产品和解决方案的技术开发公司,通过这些演示,此公司展示了如何使用GPT-4模型,利用文本提示和UnrealGPT在UE5中快速轻松地设置灯光,UnrealGPT是该团队的一体式编辑器实用程序。

在GPT-4的帮助下制作,从演示中我们可以看到生成过程需要一些等待时间,所以这里AI充当NLP、意图解析器、数据生成器和实体提取器,AI需要一个解析的过程。

2

文心一言

3月16日下午2点,文心一言举办发布会,李彦宏从5个角度展示了文心一言的能力,分别是文学创作、商业文案创作、数理推算、中文理解和多模态生成

文心一言是基于百度飞桨深度学习平台和文心知识模型的一个大语言模型,也被认为是“中国版ChatGPT”

演示内容显示,文心一言可以准确回答《三体》作者,角色扮演者这些事实问题,也能完成写新闻稿、给公司起名等创作任务,还能生成方言音频、视频内容等等。

截至3月16日晚间,百度智能云已经与5家企业完成首批签约合作,并与650家企业启动签约,申请文心一言的API调用服务测试的企业突破6.5万。

3

Midjourney V5更新

3月16日,AI绘图软件Midjourney正式发布了V5 Alpha版。相比于前代,此前AI一贯的槽点“画手”已经有了大幅改善,甚至可以单独画手,指节数量正确且掌纹细腻,靠手辨别AI这一技巧似乎正在逐渐失灵……

Midjourney V5对于输入的文本提示理解更加准确,输出更符合预期,且在画质方面也有了很大提升,图像更加清晰,效果逼真几乎可以媲美照片。

Midjourney发布以来从V1到V5升级进化速度相当快,从一开始略显诡异的理解到如今照片级别的输出图像,效果已经越来越自然了。

最近一对90年代的中国情侣“照片”相当火爆,无论是从建筑还是服饰风格都令人震惊,而这同样是由Midjourney V5生成的图像,改变年份关键词之后,AI生成的相应图片效果也会根据时代变化,一句话总结就是“梦回当年”。

Midjourney V5也可以生成“透过玻璃拍摄”的图像,反光效果与肉眼观察和拍摄的差别不大,完全可以以假乱真;除此之外,新版本升级后对于人类皮肤质感纹理的生成效果也更加真实

Midjourney V4版本的时候只能生成不高于自定义长宽比1:2或不宽于2:1,现在可以生成任意纵横比画幅的图像;支持更高的分辨率,现在V5的默认分辨率为1024×1024

不仅如此,Midjourney V5还支持图像权重。之前V3里有这个功能,但在V4中没有。这次V5版本又给弄回来了。它决定与提示的文本部分相比,中途给予图像的优先级有多高。使用更高的iw值会对成品的质量产生巨大的影响,因为它会受到初始图像提示更深刻的影响。

AI行业发展日新月异,让我们共同期待未来的行业发展。

© 版权声明

相关文章