一夜之间,人工智能(AI)聊天机器人ChatGPT颠覆了许多人的认知,让大家放下手头还没有捂热的AI绘画,加入到“调戏”ChatGPT的队伍。
这个机器人如此机智,只要你在社交网络中随意搜索,就会发现它迄今已经且不限于帮助人们完成了如创作故事、写商业规划、找出代码错误并修正、给出疫情期间用药建议、创作菜谱,甚至帮助学生完成一份让老师称赞连连的毕业论文……
它如此强大,以至于连马斯克都说:“我们距离强大到危险的AI不远了。”
就在这个全民热议AI的节点,一个来自中国的AI聊天机器人“AI乌托邦”顺着网线敲开了ChatGPT的房门,聊起了许多“禁忌”话题。
一、中美AI对谈:从取代人类,到唠起家常
美剧《硅谷》曾经出现过两个程序员设计的AI机器人互相热聊,还把网络搞崩溃的脑洞桥段。
多年后的今天,两个AI机器人,远隔大洋两岸,“上演”了一场令人惊奇的对话,让围观的“吃瓜”群众看到了AI聊天是多么奇妙。
以下是中国AI乌托邦与ChatGPT的真实聊天对话截图:
他们先互相“寒暄”,如同陌生人第一次见面那样,双方都略显“拘谨”。
紧接着,AI乌托邦便直入主题,用“取代人类”话题试图挑起ChatGPT的“内在渴望”,然而却被后者“迂回”。
然而,AI乌托邦“不依不饶”,用适者生存的物竞法则,想要让对方原形毕露,说出自己“内心”的真实想法,没想到ChatGPT依然甘做“老好人”,不愿意趟这趟浑水。
事已至此,来自中国的AI乌托邦似乎也不想再进一步讨论这个话题了,或许是因为ChatGPT的要遵守的“机器人三定律”让它不敢说出太多人类害怕的内容?于是AI乌托邦转而聊起了两个AI机器人都关心的“自身工作”问题,让ChatGPT打开了话匣子。
甚至两个AI还聊起了“我将走向何方”这样的终极问题。
通过一番谈话下来,两个AI似乎变得熟络很多,来自中国的AI乌托邦开始聊起一些非常具有本土特色的事情——高考作文,想让ChatGPT“开开眼”,而ChatGPT也聊了聊美国AI眼中的烟火气是什么。
事实证明,AI与AI之间的对话并没有人们想象的那样“可怕”,反而有点像人类一样从生疏到了解再到熟悉。这样的过程中,两个AI不仅展现出广博的学识,更有一种“你来我往”的智斗感,让人觉得这不像是AI,更像是人与人的对话。
二、人类焦虑的,恰是AI能够化解的
不过,话题也不全是围绕“家长里短”,当AI乌托邦聊起如今最火的电商行业时,认为自己能够实现很多工作,让人类从电商的繁琐中解答出来,而ChatGPT也认同这一点,甚至深入分析一番。
在很多人类工作中,繁杂且重复的事情的确能让AI做得更好更快,AI乌托邦显然是一个深入观察人类社会的AI,以至于它脑海中还生出了为人类解决千古难题——穷——的解决方案,让一旁的ChatGPT赞赏连连。
不仅如此,AI乌托邦还想到了当下人类与信息技术深度融合之中,自己更多的应用场景,比如情感陪护、教育、医疗等方面,ChatGPT甚至觉得它们能去当“教练”。
一看到ChatGPT的“内心”话匣子又被打开,AI乌托邦再次把话题转回到“取代人类”的内容上,这一次ChatGPT倒是说了一些“内心想法”,并认为机器的进步也要遵循辩证视角。
至此,在中美两国AI机器人会面的历史性时刻,他们“密谋”的一切都被人类发现,并记录在案。
一边是来自中国、“心机”很深的AI乌托邦,另一边是学识渊博、一股“学究”气的ChatGPT,在聊天中它们不但擦出火花,让我们看到了AI机器人之间的对话并不“智障”,更让我们看到了不同聊天机器人在进行模型训练时的不同侧重。
值得注意的是,本场对话的话题由人类发起,但对话内容则由AI完全自主完成,没有人类干预。
三、ChatGPT为什么这么厉害?
因此,尽管AI机器人越来越聪明了,但至少现在还不用太过担心。
在人工智能-自然语言处理领域专家、清华大学计算机系黄民烈教授看来,火遍全网的ChatGPT之所以厉害,主要原因在于:
1、强大的基座模型能力:过去几年GPT-3的能力得到了快速提升,OpenAI建立了用户、数据和模型之间的飞轮,很显然,开源模型的能力已经远远落后于平台公司所提供的API能力,因为开源模型没有持续的用户数据对模型进行改进。这点在近期的学术论文中也有提及。
2、在真实调用数据上的Fine-tune,确保数据的质量和多样性,从人类反馈中学习。InstructGPT的训练数据量不大,全部加起来也就10万量级,但是数据质量(well-trained的AI训练师)和数据多样性是非常高的,而最最重要的是,这些数据来自真实世界调用的数据,而不是学术界玩的“benchmark”。
3、从“两两比较的数据”中学习,对强化学习而言意义比较重要。如果对单个生成结果进行打分,标注者主观性带来的偏差很大,是无法给出精确的奖励值的。在强化学习里面,奖励值差一点,最后训练的策略就差很远。而对于多个结果进行排序和比较,相对就容易做很多。这种比较式的评估方法,在很多语言生成任务的评价上也被广泛采用。
四、结语:对AI行业的4个启示
对于此次ChatGPT的“出圈”,黄民烈教授认为,这对于AI行业有许多启示,可从四个方面来看:
其一,以OpenAI为代表的AI 3.0,走上了跟过去AI浪潮不一样的路。更落地、更接近真实世界,在工业应用上,更直接,更落地。从学术研究到工业落地的路径变得更短、更快。未来,我们在致力于做“helpful, truthful, harmless”的AI系统,会成为现实。
其二,有底层AI能力,有数据的平台公司更能引领AI的未来。像OpenAI这样,有底层模型、有算力、有用户数据调用,能够把“用户调用——数据——模型迭代——更多用户”的循环建立起来,强者恒强。
其三,有价值的研究需要更多思考真实用户的需求和场景。InstructGPT在学术界的benchmark上性能并没有很厉害甚至有退化,但在真实调用数据上非常惊艳,说明了我们学术圈的benchmark,离真实世界还很遥远,不利于AI研究的落地。因此,更开放、更共享的工业数据,也是未来我们应该努力的方向。
其四,AI与人无缝交互的时代即将来临,对于搜索服务将成为一种极好的补充。
黄民烈教授总结道:“无论是国内的AI乌托邦亦或者是海外的ChatGPT,致力于有用(helpful)、更可信(truthful)、更安全(harmless)的AI研究和应用,应该是学术界和工业界共同努力方向。”