机器之心报道
机器之心编辑部
不是跟不跟的问题,而是要怎么跟。
ChatGPT 引发了全球科技巨头的军备竞赛,在国内,一场竞争也在逐渐燃起,有跟进研究同型产品的公司,有从零开始建「OpenAI」的投资人,也有一系列相关项目。
近日,美团联合创始人王慧文在朋友圈高调发声,表示愿意带资 5000 万美元(约合人民币 3.4 亿元)入组并进军人工智能,以打造中国版 OpenAI 和 ChatGPT。
与此同时,国内也开始支持 ChatGPT 类大模型的研究。
昨日,在北京举行的北京人工智能产业创新发展大会上,北京市经济和信息化局正式发布了《2022 年北京人工智能产业发展白皮书》。白皮书显示,截至 2022 年 10 月,北京拥有人工智能核心企业 1048 家,占我国人工智能核心企业总量的 29%。
白皮书还提到,今年北京市将引导企业、高校、科研院所、新型研发机构、开源社区等,围绕人工智能关键核心技术创新协同攻关,持续推动建设具有全球影响力的人工智能创新策源地。同时,支持头部企业打造对标 ChatGPT 的大模型,构建开源框架和通用大模型的应用生态,形成人工智能产业发展新突破。
ChatGPT 是多项 AI 技术的集大成者,背后离不开庞大的算力、人才等资源的支持。因此,国内各大科技公司自然被寄予厚望。这些公司最近也纷纷做出了表态。在这篇文章中,机器之心通过向企业求证、根据网络公开信息整理,为大家梳理了一下各大公司的回应以及这些公司现有的技术储备,希望为大家提供一些参考。
百度:「文心一言」3 月见
在国内众多科技大厂中,百度是最早针对 ChatGPT 做出明确表态的公司之一。2 月 7 日,百度正式官宣将在 3 月上线百度版 ChatGPT——「文心一言」(英文名为 ERNIE Bot)。
随后,网上便出现了很多以「文心一言」命名的社交账号。百度方面表示,这些账号都不是真的,「文心一言」目前还处于上线前的冲刺阶段,3 月将和大家正式见面。
针对 ChatGPT 背后的技术,百度也给出了回应,称「ChatGPT 相关技术,百度都有。」「百度在人工智能四层架构中有全栈布局,包括底层芯片、深度学习框架、大模型以及最上层的搜索等应用。」而文心一言位于模型层。
这个模型层的产业级知识增强「文心」系列大模型已经布局多年,具备跨模态、跨语言的深度语义理解与生成能力。2019 年开始,百度深耕预训练模型研发,先后发布知识增强文心(ERNIE)系列模型。文心系列模型基于持续学习的语义理解框架,从大规模知识和海量数据中融合学习,效率更高,效果更好。2021 年 12 月,ERNIE 3.0 升级为全球首个知识增强千亿大模型鹏城 – 百度・文心,同时,产业级知识增强大模型文心全景图亮相。文心大模型在历次升级中持续加强知识增强,使之成为与产业级并列的两大核心特色之一。
百度的文心大模型全景图。
知情人士透露,百度搜索早就接入了文心相关技术,「文心一言」的推出或将对百度搜索的升级起到重大作用。前段时间,百度 CEO 李彦宏将 2023 年一季度 OKR 关键任务定为「引领搜索体验的代际变革」。同时,李彦宏提到,ChatGPT 相关技术已达到临界点,百度在其中有较大的机会。
「这很宏伟,很激动人心。但我们认为它是可实现的,因为技术已经到了临界点。类似 ChatGPT 这样的技术很火,如何用在搜索场景上,这是比技术本身更难探索的。怎么能把这件事情做出来,让每天有几亿人从中受益,让他们的效率有明显的提升?未来一年,在这方面我们非常有机会。」李彦宏称。
「此次文心一言落地,首站将直接接入百度搜索。」知情人士透露,「一些相关功能已陆续在百度搜索内上线或内测,包括多答案回复、智能生成等」。
华为:在大模型领域早有布局
和百度不同,华为这一轮的回应并没有透露对标 ChatGPT 的具体计划,而是对自家在大模型方面的投入进行了简短回顾。
华为计算产品线相关负责人表示,公司 2020 年在大模型领域开始有布局,2021 年基于昇腾 AI 与鹏城实验室联合发布了鹏程。盘古大模型,是业界首个千亿级生成和理解中文 NLP 大模型。在模型性能方面,当时的鹏程。盘古大模型性能全球领先,16 个下游任务中性能指标优于业界 SOTA 模型。在应用方面,鹏程。盘古支持丰富的应用场景,在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出。
该负责人还表示,在大模型产业化方面,华为已发起了智能遥感开源生态联合体、多模态人工智能产业联合体、智能流体力学产业联合体等。华为将以联合体的模式把科研院所、产业厂商等结合起来,更好地让大模型产业形成正向的闭环回路。
这些联合体由国内多个学界、业界机构组成,他们围绕自身与华为构建的一些基础设施展开大模型研究。比如:
中科院自动化所基于昇思 MindSpore 打造了全球首个千亿参数三模态大模型紫东。太初,通过跨模态语义关联达成了视觉 – 文本 – 语音三模态的统一表达和高效协同;鹏城实验室基于昇思 MindSpore AI 框架打造了面向生物医学领域的 AI 平台 —— 鹏程。神农,包含蛋白质结构预测、小分子生成、靶点与小分子相互作用预测以及新抗菌多肽设计与效果评价等模块,深度赋能生物制药;武汉大学利用武汉人工智能计算中心 AI 集群推出了武汉.LuoJia,包含全球首个遥感影像智能解译专用框架武汉.LuoJiaNET 和业界最大遥感影像样本数据集武汉.LuoJiaSET,并已于今年 6 月分别上线昇腾和昇思社区;
在华为伙伴暨开发者大会 2022 上,华为发布了其昇腾大模型沙盘规划,明确了基础大模型和行业大模型 / 应用并行发展的整体布局。
腾讯:在相关方向上已有布局
腾讯对 ChatGPT 的回应发布于 2 月 9 日。该公司表示:「目前,腾讯在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入 AI 等前沿技术的研发,基于此前在 AI 大模型、机器学习算法以及 NLP 等领域的技术储备,将进一步开展前沿研究及应用探索。」
相关技术储备包括「混元」系列 AI 大模型、智能创作助手文涌(Effidit)等。
其中,混元 AI 大模型完整覆盖 NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业 / 领域模型。「文涌」的实现融合了知识抽取、文本理解、文本生成、大规模预训练模型、经典语言模型、搜索等技术,具有智能纠错、文本补全、文本润色等功能,部分功能的实现使用「混元」系列 AI 大模型作为底层预训练模型。
去年,混元 AI 大模型团队推出了万亿级别中文 NLP 预训练模型 HunYuan-NLP-1T,该模型已落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。随着 AIGC 兴起,未来混元 AI 大模型会不断推进在文本内容生成、文生图等领域的持续升级。
字节跳动:当前不做过多回应
2 月 9 日,有传闻称,字节跳动的人工智能实验室(AI Lab 有开展类似 ChatGPT 和 AIGC 的相关研发,未来或为旗下 PICO 提供技术支持。
但随后,PICO 相关负责人否认了传闻,说消息不实,PICO 目前没有采用类似 ChatGPT 技术的产品规划。
机器之心就相关问题询问字节跳动,字节表示当前不做过多回应。
在 AIGC 方向,字节跳动的研究成果包括非自回归模型 DA-Transformer、端到端语音到文本翻译模型 ConST、多颗粒度的视觉语言模型 X-VLM、图片和文本统一生成模型 DaVinci 等。其中 DA-Transformer 在机器翻译上首次达到了 Transformer 同样的精度,而处理的速度提高了 7~14 倍。DA-Transformer 不仅可以用于机器翻译,而且可以用于任意的序列到序列任务。
阿里巴巴:确实在研发中
关于阿里巴巴入局 ChatGPT 的传闻始于一张截图。该图显示,阿里巴巴可能将 AI 大模型技术与钉钉生产力工具深度结合。对此,阿里巴巴称,「确实在研发中,目前处于内测阶段,后续如有更多信息,会第一时间和大众同步。」
这一展示是阿里巴巴过去几年在大模型领域持续布局的成果。
2021 年初,阿里巴巴达摩院提出了百亿参数的超大规模中文多模态预训练模型 M6,并持续推出多个版本,参数逐步从百亿规模扩展到十万亿规模,在大模型、绿色 / 低碳 AI、AI 商业化、服务化等诸多方面取得突破性进展。
2022 年,在探索算力极限的同时,他们也积极展开了针对通用模型的探索,提出业界首个通用的统一大模型(模态、任务和架构)M6-OFA,极大地降低了模型在预训练、适配下游任务、推理过程中的难度。这个大模型是达摩院公布的阿里巴巴「通义」大模型系列的一部分。该系列分为三个层级:最底层为统一模型底座,中间基于底座的通用模型层覆盖了通义 – M6、通义 – AliceMind 和通义 – 视觉,专业模型层深入电商、医疗、娱乐、设计、金融等行业。
京东云:将推出「产业版」ChatGPT
2 月 10 日,京东云通过官方公众号发布了将推出「产业版」ChatGPT——ChatJD 的消息,同时公布了 ChatJD 的落地应用路线图「125」计划。
京东云指出,ChatGPT 在通用性方面已经展现出强大的能力,但在忠实度、可信度、精准度方面还存在一些不足,这主要是由于在中间层缺少垂直的产业知识和领域知识,难以在真实应用层广泛落地开花。
因此,基于产业需求,京东云旗下言犀人工智能应用平台将推出 ChatJD,定位为产业版 ChatGPT,旨在打造优势、高频、刚需的产业版通用 ChatGPT。ChatJD 将通过在垂直产业的深耕,快速达成落地应用的标准,并不断推动不同产业之间的泛化,形成更多通用产业版 ChatGPT,构建数据和模型的飞轮,以细分、真实、专业场景日臻完善平台能力,最终反哺和完善通用 ChatGPT 的产业应用能力。
京东集团副总裁何晓冬称,相较于传统聊天机器人,京东的场景更加垂直,必须解决用户的问题,更加聚焦于任务型多轮对话,考量的是对话的精准度、客户的满意度,满足成本、体验、价格、产品、服务等要素的要求。
ChatJD 将以「125」计划作为落地应用路线图,包含一个平台、两个领域、五个应用。
1 个平台:ChatJD 智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级;2 个领域:零售、金融,得益于京东云在零售与金融领域 10 余年真实场景的深耕与沉淀,已拥有 4 层知识体系、40 多个独立子系统、3000 多个意图以及 3000 万个高质量问答知识点,覆盖超过 1000 万种自营商品的电商知识图谱,更加垂直与聚焦;5 个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业复用程度最高的应用场景,在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域将发挥广泛的落地价值。
这些计划基本是京东既有工作的延续。在通用型 Chat AI 方向,京东云已经拥有包括京东智能客服系统、京小智平台商家服务系统、智能金融服务大脑、智能政务热线,言犀智能外呼、言犀数字人等系列产品和解决方案。拆解到细分技术领域,京东云在文本生成、对话生成、数字人生成方向等方向也已经做出了一些成果。
具体到语言生成方面,京东 NLP 团队提出的基于领域知识增强的预训练语言模型 K-PLUG 可以在一定程度上解决生成文本的「可控性」问题。目前,该模型已经覆盖了京东的 3000 多个三级品类,累计生成文案 30 亿字,应用于京东发现好货频道、搭配购、AI 直播带货等。
网易有道:将 AIGC 投入教育场景
据报道,网易有道 AI 技术团队已投入到 ChatGPT 同源技术 AIGC(AI Generated Content)在教育场景的落地研发中。
2 月 9 日,网易有道向媒体证实了这一消息,并表示近年来一直在 AIGC 上有持续性投入。去年底尝试 AIGC 在教育场景中的落地应用,包括但不限于 AI 口语老师、中文作文打分和评价等。据相关负责人透露,近年来,有道团队在神经网络翻译、计算机视觉、智能语音 AI 技术、高性能计算等关键技术方面均取得重要突破。
网易有道表示:「产品的最终形态团队还在讨论中,需要匹配用户需求来决定,智能硬件、在线课程都可能是考虑落地的场景。」
此前,AI 绘画成为了 AIGC 领域第一个破圈的应用,作为内容创作的新方式,AIGC 已经从早期辅助人类内容创造,发展到如今的独立完成内容创作的新阶段。
快手:已启动相关专项
作为一款国民级短视频 App 背后的公司,快手的业务和 AIGC 息息相关。因此,快手也对 ChatGPT 做出了回应。机器之心获悉,目前,快手正在开展大规模语言模型(LLM Large Language Model)正在开展大规模语言模型,并启动了相应专项,覆盖 LLM 模型训练、文案自动创作与生成、对话系统开发等领域。
内部有关人士介绍称,快手在 LLM 领域的研究,更聚焦于用户体验的提升,以及和业务场景的融合。例如,对话系统在快手中的主要应用场景包括虚拟人、电商智能客服、智能助理等人机交互或人人交互场景。相关研究的推进,将赋予 LLM 与人类自然交互的能力,对于 to B 类业务场景的扩展将有重要帮助。
科大讯飞:5 月进行产品级发布
作为 A 股上市公司,科大讯飞作为 AI 领域标的在 ChatGPT 概念兴起后涨幅不小。2 月 8 日晚间,科大讯飞在投资者互动平台回应称,ChatGPT 主要涉及到自然语言处理相关技术,属于认知智能领域的应用之一,公司在该方向技术和应用具备长期深厚的积累。科大讯飞 AI 学习机将成为该项技术率先落地的产品,将于今年 5 月 6 日进行产品级发布。
作为 AI 龙头的科大讯飞,在 NLP 方面同样有诸多研究积累。获悉,科大讯飞主导承建了认知智能全国重点实验室。这一实验室是科技部首批 20 家标杆全国重点实验室之一,多年来始终保持关键核心技术处于世界前沿水平,在去年曾获得 CommonsenseQA 2.0、OpenBookQA 等 12 项认知智能领域权威评测的第一。
与此同时,科大讯飞面向认知智能领域陆续开源了 6 大类、超过 40 个通用领域的系列中文预训练语言模型,成为业界最广泛流行的中文预训练模型系列之一,在 GitHub获 13346 颗星,位列中文预训练模型星标数第一。
从 2009 年开始,科大讯飞就已着手进行算力基础设施建设,目前已建成 4 城 7 中心深度学习计算平台,算力不仅完全满足 AI 算法模型训练,还能面向开放平台数百万开发者和其他行业伙伴提供相关的服务。
科大讯飞也在进行算力的自主可控探索。目前讯飞研发训练服务器已经开始进入国产化,切换之后效率有的是原来平台的 70-80%,有的效率是超原来平台 100+%。而在算法上,也启动了推理服务器的国产替代;典型产品如学习机芯片已经全部切换成国产自主。
360:正在构建 ChatGPT 安全应用
继前两年布局新能源汽车、入局元宇宙后,360 近日也对外公布,计划推出类 ChatGPT 的 demo 版产品。「如果企业搭不上 ChatGPT 这班车,很可能会被淘汰,」在 2 月 9 日的活动中,周鸿祎表示。
在 2 月 7 日的答投资者提问会议上,360 表示有 200 多亿的资金能够支持 360 进行类 ChatGPT 技术的研究和投入,虽不及谷歌、百度,但也强于许多 A 股上市的搜索引擎企业。根据最新财报数据,360 在 2022 年第三季度披露的货币资金总额达 218.79 亿元。同时,360 还在调整投资战略,出售与自身主营业务协同性较低的投资项目,回笼更多的资金。
在技术积累上, 360 在 2019、2020 年左右便看到了技术变革的可能,成立了人工智能研究院,投入了相当的人力、算力去做人工 AI 场景,研发侧重点建立在自身的业务优势上,即安全 AI。
随着 ChatGPT 的应用推广以及各大科技巨头陆续入局类 ChatGPT 赛道,产业界和学界也越来越重视 ChatGPT 类模型可能带来的安全风险。
在当前,ChatGPT 有能力生成漏洞恶意攻击软件,随着这类 AI 的发展,未来还可能做到控制具有恶意攻击性的工具集群,对整个网络构架进行有步骤的攻击。在网络安全的需求下,安全 AI 可以帮助使用者发现恶意攻击、高级威胁和大型软件漏洞,应用潜力也将放大。
360 方面表示,当前对类 ChatGPT 的研发已经进行了数字安全 AI 识别。基于其训练的 AI 模型,刻画了专门针对于数字安全训练的大模型,并给它投喂了 360 安全卫士形成的安全类大数据。
不过,该类业务距商业化还有一定的距离。
目前,ChatGPT 所带来的这波 AI 热度还没有降温的趋势,未来还将有更多公司宣布入局。但正如搜狐创始人张朝阳所说,这是一件需要谨慎对待的事情,「ChatGPT 积累了许多年,涉及算力要有多少服务器,知识库、标注等很多问题,没有这些能力的公司跟风入局,会消耗掉许多资源。但具有人工智能 AI 以及有搜索能力的公司,也需要做好准备。」
未来机器之心将持续报道国内相关项目的进展,期待中国能做出不弱于 ChatGPT 的项目。