谁能玩转ChatGPT

ChatGPT编程1年前 (2023)发布 一起用AI
1,108 0 0

  过去两个月,选择押注ChatGPT的中国公司和个体纷纷涌现。

  2月13日,原美团联合创始人王慧文发帖称,将出资5000万美元,打造中国OpenAI,设立估值2亿美元(约13.6亿元)的科技公司。

搜狗前CEO王小川也回复媒体称,“快速筹备中”,正与产业界和学界的重要人士进行密切沟通。

  谁都希望赶上ChatGPT的热度,成为第一个占领市场的赢家。

谁能玩转ChatGPT

3月15日凌晨1点,OpenAI正式推出GPT-4文本生成AI系统

  但问题来了,怎么做?

粤港澳大湾区数字经济研究院(IDEA)讲席科学家张家兴告诉南风窗,如果发展类ChatGPT的千亿参数大模型,却一直无法证明自己的价值,大厂能否继续坚持投入,是一个值得担心的问题。

  但势不可挡地,赶潮的锣鼓已经敲响。

  焦急地等待与追赶中,仍有问题待解:玩家云集的赛道,到底能给公众带来什么应用和改变?

  ChatGPT的商业化故事,会是下一个哑火的元宇宙吗?

01

  火热的市场

人工智能圈很久没那么热闹了。

  一位研究自然语言的AI行业人士告诉南风窗,2020年时,人工智能坐了几年的“冷板凳”,行业一片看衰。其所在公司因此“人员收缩”,裁了1/4的员工。

清华大学计算机系自然语言处理实验室副教授刘知远对南风窗回忆,AI在历史上成功出圈的次数不多。上一次备受瞩目,要属2017年击败柯洁的围棋AI——AlphaGo的推出。

谁能玩转ChatGPT

2017AlphagoVs柯洁大赛(乌镇) 柯洁大比分0-3遭零封

相比之下,ChatGPT的热潮从2022年末持续至今,让人意外。“没想到ChatGPT这么火,”上述行业人士说,“有时看到ChatGPT还在刷屏,我感到厌烦了。”

公众的关注,传导至了做自然语言处理技术的AI公司。

  清华大学孵化的AI初创企业——聆心智能的联合创始人郑叔亮告诉南风窗,2月,他平均每天要面对4至6个主动前来交流的公司或团队。

这与过去需要主动对外介绍AI产品截然不同。“以前听到生成式的模型,大部分人都持怀疑态度,说AI到底靠不靠谱?”但现在,“从上到下,大家都在积极拥抱这门技术”。

  他回忆,接洽的客户中,一向对信息安全谨慎的医院,都在主动了解ChatGPT类产品,“态度有180度的大转变”。

热门的AI对话赛道,让中国公司和研究机构前仆后继。

  2月20日晚,复旦大学邱锡鹏教授团队发布国内首个类ChatGPT应用MOSS,因访问量太大停机。

谁能玩转ChatGPT

复旦MOSS回应服务器崩溃:模型还不成熟,完成初步验证将开源

2月27日,秘塔科技发布大模型产品“对话写作猫”,成为首个国产公开可用的类ChatGPT产品。用户可以通过与AI对话的形式,获得回答或生成内容,完成写文案、文生图等AI生成内容(AIGC)的任务。

  秘塔科技CEO闵可锐回复南风窗称:“最近比较忙,算是在最一线做相关产品落地探索。”

  AI赛道的火热,从招聘市场可见一斑。

脉脉CEO林凡透露,这段时间,科技巨头相继加快在AIGC的布局。猎头、企业HR都在发布大量AIGC技术高薪岗位,力求抢占先机。

  专注自然语言处理的AI企业——追一科技的CEO吴悦对南风窗表示,ChatGPT之所以在业界掀起狂潮,是因为证实了大语言模型(LLM)的可行之处。

升级更新后的GPT-4,处理文字内容的上限拓展到2.5万个字符,是ChatGPT的8倍

“自然语言处理(NLP)技术过去有个特点,多任务多模型,每个任务都有一个小模型。例如,搜索有它专门的NLP系统,推荐有推荐的NLP。”

  由于小模型很分散,从商业角度来看,“比较难规模化”,吴悦说。

  ChatGPT的出现,“论证了大语言模型可以执行多任务”。他解释,当训练一个模型可以同时满足多种需求,“经济效应便有机会最大化”。

他回忆,团队过去几年在研究大模型的底层算法,但一直没将它工程化为产品,“时机还不成熟”。

  现在,乘着ChatGPT的东风,是时候投资押注了。

02

  进场的玩家

火热归火热。上述公司负责人都认为,入局大语言模型是一件门槛很高的事情。

  不是每个团队都有做OpenAI的本领和底气。

  张家兴分析,对于互联网大厂,有充足的算力、人力和数据资源,可以持续投入千亿参数以上的大模型,构建自己的技术壁垒。

吴悦告诉南风窗,ChatGPT背靠至少1750亿参数的大模型,在商业化过程中也有短板。

  比如,运行和训练成本高昂。这将阻碍“最后一公里”场景的落地。

“我们判断,OpenAI推出的通用大模型,需要结合场景进行专门的training(训练)。”

  他举例,都是基于GPT-3.5模型,ChatGPT和必应搜索引擎的表现却不同。“ChatGPT和必应(的模型)可能有各自的任务,都要进行专门训练。”

对于希望拥抱AI的企业而言,高昂的训练成本将成为一大阻碍。据披露,GPT-3训练一次的成本约为140万美元(约合960万元)。

谁能玩转ChatGPT

国盛证券基于参数数量和token数量估算,GPT-3训练一次的成本约为140万美元

但在强势的OpenAI和公众瞩目下,互联网大厂只能迎战。

  匆匆推出Bard的谷歌,遇到了相似难题。

2月22日,谷歌母公司Alphabet董事长约翰·亨尼斯透露,大型语言模型的对话成本,可能是传统搜索引擎的10倍以上。谷歌因此必须降低运营成本,但这一过程并不容易。

  “最坏情况,(降成本)需要几年时间。”

  高昂的成本,注定了这并非回报率快的生意。

张家兴分析,如果训练出类ChatGPT的大模型,“模型的尺寸如此巨大,如果没有底层算力技术的进步,也没法以很低的成本服务到每个人”。

根据国盛证券估算,今年1月,平均每天约有1300万访客使用ChatGPT,对应芯片需求为3万多片英伟达A100GPU。这些流量带来的初始投入成本约为8亿美元(约合55亿元),每日电费在5万美元左右(约合34万元)。

对于一些更大的LLM模型(如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM),训练成本介于200万美元至1200万美元之间

权衡之下,吴悦认为,对于像追一科技这种面向企业服务的AI公司,做百亿级别参数的大模型,才是较为可行的方案。

“知识的深度和广泛性决定了系统的难度与复杂度。大厂对标完整复制ChatGPT,创业公司则可以基于语言理解,结合领域内知识,形成垂直领域或者行业ChatGPT。”

  他判断:“训练百亿级模型不是一个太高的门槛。千亿级和百亿级模型之间,训练成本可能是百倍的差距。”

张家兴也同意,千亿级大模型和百亿级大模型适合的场景不同,玩家自然也会分化。

谁能玩转ChatGPT

  拥有技术、算力和资源的百度等大厂适合前者,即所有功能聚合到一个模型,具有通用性。在面向消费者(to C)端,需求多样,很适合 “万能”的千亿级模型。

而面向企业(to B),需求可以事先定义,却往往需要具体定制。

  “这时,百亿级模型体现出定制成本低和训练速度快等优势。”

上述业界人士都有相似的设想。随着投入AI大模型的公司越来越多,商业化的场景和机遇也愈加多样。而千亿甚至更高参数的国产大模型,将来可能成为基础模型,服务其他企业进行私有化部署和改造。

03

  理想与现实

  以发展自然语言大模型为路径的AI,在许多技术乐观派看来,给人类社会带来了充满想象力的未来。

埃隆·马斯克形容,ChatGPT是不亚于iPhone的发明。比尔·盖茨将其比作“不亚于重新发明互联网”。

郑叔亮告诉南风窗,ChatGPT让各行各业变得兴奋,但同时带来紧张跟焦虑,“(即将)抢了很多人的饭碗,也会把既有商业模式和结构打破”。

  他介绍,大语言模型出圈后,各类应用场景已经应接不暇。教育、游戏、心理等领域,都会迎来大突破。

谁能玩转ChatGPT

ChatGPT回答关于AIGC“抢饭碗”的问题

郑叔亮透露,公司近日接到游戏公司的一些需求——开发“智能NPC(非玩家角色)”,以提供沉浸式、交互体验好的游戏。

教育也会是AI大模型广泛应用的版块。他介绍,在创新型教育的趋势下,当前的互联网教育研发,围绕着策划、内容创作、编排脚本等展开,是一个特别长的链路。

  但拥有了智能大模型后,“一些关键环节可以提供AI服务,帮老师们减负”。今后,“老师们可能更多是AI训练师的角色了”。

相似地,吴悦也在AI领域看到了质变的希望。他创办的AI公司深耕金融、运营商、政务的垂直领域,基于深度学习向企业提供对话机器人的服务。“接下来我们要把已有的行业、已知的场景从深度学习升级到大模型。”

他希望,升级后的AI不仅能智能对话,还能分析数据,“还可以同时完成不同媒介的任务,如语音、数字人……”

谁能玩转ChatGPT

在OpenAI官方发布的视频中,GPT-4能够识别随手画的草图为一个关于网站的草图,然后快速生成了这个网站的全部代码并创建网站

ChatGPT惊艳的表现,给予人工智能公司前行和突破的信心。但这些业内负责人同时表示,看待新技术应保持冷静。

科学家张家兴告诉南风窗,ChatGPT的出现揭示了AI几十年发展的一大趋势:工程化。“AI原本是大学和实验室中一些天才科学家做出的创造性工作,现在却变成了OpenAI这种举公司之力几百人合作的项目。”

  “如何协调这么多算法和工程专家合作训练一个模型,是一个很不容易的管理问题。”

  CEO吴悦担心的也是工程的部分。

他坦言,训练一个大模型,即使大方向确定,将它落地的过程仍有很多问题待解。

“哪怕我的方法确定,原理确定,但工艺上的打磨要根据不同的任务,训练不同的大模型。如数据源怎么选取;选取完后怎么生成高质量的数据;基于高质量数据,强化学习算法怎么设计……”

  “这其中会有很多的试验,以及许多工业性的系统有待构建。”吴悦说。

  郑叔亮也表示,资金在当中不是最关键的。“关键是,怎样在具有商业化前景的领域,尽快把我们的技术变成预想的现实。”

上述匿名的AI行业人士告诉南风窗,虽然GPT模型的技术原理已经对外公开,但在具体操作上,怎样做出类似ChatGPT良好的交互效果,存在很多未知数。

“说白了,就算把操作方法告诉了你,做出来的东西还可能不是同一个玩意。”

  一众公司都在摸着石头过河。

  吴悦说,先发优势也很重要。“谁先做出来,进入到商业的闭环、技术的闭环,就能占到先发优势。”

04

  押注“摩尔定律”

  世人在为ChatGPT澎湃。

2月27日,OpenAI公司CEO山姆·奥特曼(Sam Altman)在社交媒体上发言:“新版摩尔定律很快就要来了,宇宙中的智能数量每18个月就会翻一倍。”

这是一段颇具争议的发言。要是这番话放在往日,可能被视为狂人语录。但现在,多的是相信奥特曼的拥趸。

  广泛用在半导体领域的摩尔定律,在上世纪60年代由英特尔联合创始人摩尔提出。大意是说,随着需求和技术的增强,集成电路可容纳的晶体管数目,每隔18个月便会增加一倍。

增长之余,成本并没有上升。

  摩尔定律跟随着20世纪末半导体产业的繁荣得到验证。显然,奥特曼想让AI变成下一个革新人类的半导体业。

OpenAI公司CEO山姆·奥特曼

ChatGPT给人工智能业界注入了强心剂,同时将入局者引入大手笔烧钱、大举押注的方向。

  张家兴告诉南风窗,ChatGPT预示了AI行业模型化发展趋势。

  “AI模型化在说明,AI的成本从复杂系统构建,变成了大模型训练需要的算力。

ChatGPT千亿模型几百万美元一次的训量成本,就是AI模型化之后的代价。”

  处在追赶状态的中国公司,只能放手一搏,拼命抓住难得的公众关注。

在张家兴看来,“OpenAI是对GPT系列模型持续探索和打磨了至少3年,才有了如此领先的ChatGPT”。“中国版ChatGPT想追上,要付出很多时间。这个过程,大多数公司能否坚持下来,也是巨大的未知数。”

  郑叔亮说,中国拥有很好的AI发展环境,受地域、语言文化、政策等保护,也拥有较大的市场体量。

“当下唯一要做的事情还是开放。打破各家之间的竞争壁垒,以开放的姿态拥抱新时代,而不是再次陷入恶性竞争的态势。”

  百度的文心一言也许不如众人的高期待。但可以肯定的是,这只是开始。

文中配图部分来源于视觉中国,部分来源于网络

  作者 | 吴大宇

  编辑 | 向由

  新媒体编辑 | 吴擎


© 版权声明

相关文章