从ChatGPT看国内的算法、算力、数据投资机会

ChatGPT编程2年前 (2023)发布 一起用AI
512 0 0

原标题:从ChatGPT看国内的算法、算力、数据投资机会

开年之后,讨论最多,争议最大的就是Ai人工智能板块。流浪地球2、ChatGPT的爆火都让人突然发现,科幻电影里的情节已经成为现实。在流浪地球2之前,还有另外一部经典改编自小说的科幻电影也重点提到了人工智能的影响:《银河系漫游指南》。

在电影中,一个具有高度智慧的跨纬度生物种族为了找出一个关于“生命、宇宙以及任何事情的终极答案”,造出了一台名为“深思”(Deep Thought)的超级电脑进行计算。而在经过长达750万年的运算与验证之后,超级电脑得出的最终答案是“42”。

至于答案为什么是“42”,这里不展开说了,有兴趣的可以去自行看电影或者小说了解。

现在回过头来看,有意思的地方在于:“深思”(Deep Thought)这台超级计算机为什么需要长达750万年的运算与验证才能得出答案?

原因在于电影的改编源自1979年英国作家道格拉斯·亚当斯(Douglas Adams)的系列科幻小说《银河系漫游指南》。当时的计算机还是庞然大物,运算速度现在来看非常不堪。而44年后的今天,超级计算机、量子计算机的运算速度及数据存储量对比当年已经是天壤之别,是当时想都不敢想的科幻程度。

如果按今天的全球总算力再来让“深思”计算这个宇宙终极答案可能只需要1秒钟。这其中最关键的就是人工智能三要素:算法、算力、数据。

人工智能产业也将是人类的第三次工业革命。

以上这张图片解释了人工智能三要素之间的关系:算法、算力、数据。

看懂这张图就理解了产业投资的相关机会。例如ChatGPT就是典型的人工智能应用公司,微软、百度属于平台公司。之前不少被爆炒过连续20cm涨停的属于数据类、算法类公司。还有刚开始抬头的算力相关芯片公司。

需要注意的是目前A股有些被爆炒的概念股只能算应用公司的下游,将ChatGPT应用在他们的业务中。当概念炒可以,但完全不满足于人工智能三要素的投资方向。

目前比较符合上述三要素的公司有:

算法:云从科技、汉王科技、海天瑞声等

算力:海光信息、寒武纪、中科曙光等

数据:中国联通、中国移动、阿里巴巴、百度等

算法和数据相关公司前期已经炒过,这里先重点分析算力的投资机会(算力相对简单理解),若文章反响好我将会继续更新。

首先一句话总结:算力就是GPGPU。

GPU 最初的设计目标是为了提升计算机对图形、图像、视频等数据的处理性能,解决 CPU 在图形图像领域处理效率低的难题。随着 GPU 在并行计算方面性能优势的逐 步显现以及并行计算应用范围的逐步拓展,GPU 逐渐分化成两条分支,一条是传统意 义的 GPU,延续专门用于图形图像处理用途,内置了视频编解码加速引擎、2D 加速引 擎、3D 加速引擎、图像渲染等专用运算模块;另一分支是 GPGPU,作为运算协处理器,并针对不同应用领域的需求,增加了专用向量、张量、矩阵运算指令,提升了浮点运算 的精度和性能,以满足不同计算场景的需要。

随着 GPGPU 的技术发展和相关生态环境的逐步完善,其用途被进一步发掘。目前,GPGPU 已经广泛用于商业计算和大数据处理,如天气预报、工业设计、基因工程、药 物发现、金融工程等。在人工智能领域,使用 GPGPU 在云端运行模型训练算法,可以 显著缩短海量训练数据的训练时长,减少能源消耗,从而进一步降低人工智能的应用成 本。与此同时,GPGPU 能够提供完善的软件生态系统,便于各种已有应用程序的移植 和新算法的开发,因此全球人工智能相关处理器解决方案仍然是以 GPGPU 为主。因此,GPGPU 是人工智能领域最主要的协处理器解决方案,占据人工智能 90%以上的市场份 额,在智能工厂、无人驾驶、智慧城市等领域具有广泛的市场空间。

一、GPGPU 市场规模概述

GPGPU 能够提供强大、高效的并行计算能力,被广泛用于人工智能、商业计算、

大数据处理等领域。

1 全球市场规模

近年来,随着人工智能、数据挖掘等新技术的发展,集成电路行业迎来了数据中心 引领发展的阶段,对海量数据进行计算和处理将成为带动集成电路行业发展的新动能。大规模张量运算、矩阵运算是人工智能在计算层面的突出需求,高并行度的深度学习算 法在视觉、语音和自然语言处理等领域上的广泛应用使得计算能力需求呈现指数级增 长。根据 Cisco 的预计,2021 年全球数据中心负载任务量将超过 2016 年的两倍,从 2016 年的不到 250 万个负载任务量增长到 2021 年的近 570 万个负载任务量。

人工智能算法的不断普及和应用,以及对商业计算和大数据处理的算力需求的不断 增长,使得全球范围内数据中心对于计算加速硬件的需求不断上升。作为 GPGPU 领域 的代表性企业,NVIDIA 数据中心业务收入在 2015 年仅为 3.4 亿美元,2020 年高速增 长至为 67.0 亿美元。从 2015 年至 2020 年,NVIDIA 数据中心业务的年均复合增长率为 81.52%,其增速远超 NVIDIA 其他板块业务的收入增速。NVIDIA 数据中心业务收入的 快速增长体现了下游数据中心市场对于泛人工智能类芯片的旺盛需求。

2 国内市场规模

人工智能领域的应用目前处于技术和需求融合的高速发展阶段,在运算加速方面逐 渐形成了以GPGPU解决方案为主的局面。根据前瞻产业研究院的数据,未来几年内,中国人工智能芯片市场规模将保持年均40%至50%的增长速度,到2024年,市场规模将 达到785亿元。而随着人工智能相关技术的进步,应用场景将更加多元化,GPGPU通用 性好和软件生态系统完善的优势会进一步展现出来,成为该领域的主流解决方案。GPGPU在我国人工智能芯片领域也将占据较大比例的市场份额。

二、GPGPU 芯片行业未来发展趋势

(1)GPGPU 技术发展趋势

中国人工智能芯片市场规模(亿元)

随着 GPGPU 在大数据处理、人工智能、商业计算领域的广泛应用,其价值得到了 学术界和工业界的认可,技术不断发展,呈现了以下发展趋势。

1 性能需求不断提升

随着新材料、新能源以及分子药物开发等领域的技术发展,多个新兴领域的算力需 求日益增加。此外,近年来人工智能呈现快速增长,推动人工智能发展的三大要素分别 是算法、数据和算力,其中算力更是被形容为“支撑人工智能走向应用的发动机”。因 此 GPGPU 需要不断升级硬件来满足日益增长的运算需求。

GPGPU 产品提高性能的关键技术包括:进一步提升工艺制程、增加运算核心数量、采用更高带宽的片上存储器、提高存储器的带宽和容量等。通过上述技术创新,GPGPU 芯片集成度不断提高,性能逐渐增强,性能功耗比逐渐提升。

另一方面,单一芯片性能的提升已经无法满足不断涌现的大数据量、多任务应用的 需求。因此,高带宽、低延时的片间互连总线结构也是未来产品优化提升的方向之一。

2 GPGPU 将成为运算协处理器的主流

运算协处理器基于不同的设计思想存在多条技术路线,包括 GPGPU、ASIC、FPGA 等。其中 GPGPU 的代表企业包括 NVIDIA 和 AMD;利用 ASIC 技术,许多大公司都 研发了协处理器产品,包括 Intel 的 Phi 和 NNP、Google 的 TPU、华为昇腾、寒武纪思元等;基于 Intel、Xilinx 的 FPGA,出现过很多专用协处理器产品。综合考虑性能、能 效比和编程灵活性等方面的因素,GPGPU 在协处理器应用领域具有非常明显的优势,目前广泛应用于商业计算、人工智能和泛人工智能等领域。

3 CPU 与 GPGPU 的异构计算

因为设计的出发点不同,CPU 和 GPGPU 的架构有着巨大的差异。CPU 一般由逻 辑运算单元、控制单元和寄存器组成。因为 CPU 有复杂的数字和逻辑运算单元,并辅 助有分支预测乱序执行等逻辑电路,所以 CPU 拥有强大的逻辑控制处理和运算能力,能够处理复杂任务。CPU 虽然支持多核结构,但是由于 CPU 内部设计非常复杂,核心 数较少。GPGPU 内部包括大量的运算单元核心,其架构决定了 GPGPU 具有处理并行 计算任务的优势。但是,GPGPU 每个核心拥有的缓存相对较小,核心的逻辑功能简单,只能执行有限种类的逻辑运算操作。GPGPU 内部的核心通常被划分成若干个组,组内 核心不能独立工作运行,需要协同工作共同完成运算任务。

CPU 和 GPGPU 的结构特点不同,适用于不同的应用场景,把两者结合起来可以充 分发挥各自优势,CPU 处理复杂的逻辑控制并进行运算管理,GPGPU 用于对各种大规 模并行计算进行加速。CPU+GPGPU 的异构运算架构可以让系统具有更大灵活性,满足 复杂场景的不同需求,能够较大幅度地提升单独使用 CPU 或 GPGPU 的任务执行效率; CPU 和 GPGPU 之间还可以通过内存共享等方式进行数据交互,发挥异构计算的优势。

(2)GPGPU 在商业领域的具体应用

1 商业计算和大数据处理

随着信息化社会的飞速发展,互联网、大数据分析、深度学习等新技术的不断涌现,人们对信息处理能力的要求越来越高,大数据处理不仅应用在石油勘探、天气预报等传 统领域,互联网、金融、数据挖掘、教育等领域对大数据处理和商业计算的需求也呈现 高速增长的趋势。

2 人工智能处理器

当前人工智能技术发展正处于第三波浪潮上,第三波浪潮最大的特点就是与业务紧 密结合的人工智能应用场景逐渐落地,拥有先进算法和强大计算能力的企业成为了最主 要的推动者。当前人工智能的主流技术路线是深度学习,但深度学习尚存在局限性,在机器感知类场景表现优异,但在机器认知类场景的表现还有待提高。未来针对不同的人 工智能应用类型和场景,将会有深度学习之外的新算法出现,这就要求人工智能芯片能 够适应不同类型的算法,具有兼顾性能和灵活性的能力。GPGPU 具有完善的软件生态 环境和编程灵活性,能够更好地适应未来人工智能领域的发展需求,将成为人工智能处 理器的主流产品。

3 智算中心

近年来,中国各地政府掀起了大型智算中心的建设热潮,在武汉、上海、大连、郑 州、西安、合肥等地均有布局。聚集强大人工智能算力的智算中心是中国数字经济高速 发展的产物,是一种新型的公共基础设施。国家已经出台了相关政策,并把智算中心列 为“新基建”。智算中心的本质是算力的供应和生产平台,它向人工智能企业出售算力,帮助其将技术模型变为现实,参与自建或承建的企业,包括互联网公司、服务器公司等。由于算法的演进,人工智能对算力提出了巨大的需求,业界预测 GPGPU 将推动人工智能推理性能每年提升一倍以上。

三 投资机会分析

目前算力芯片的绝对龙头是美国英伟达公司,算力硬件以A100,H100为代表(A100算力卡国内售价10万RMB左右一块),而软件层面英伟达几乎垄断了CUDA生态。

光有高参数的算力是不够的,还需要软件的生态,而CUDA生态已经被英伟达垄断,所以英伟达的对手AMD推出了对应的:ROCm生态。由于 ROCm 和 CUDA 在生态、编程环境等方面具有高度的相似性,CUDA 用户可以以较低代价快速迁移至 ROCm 平台。而百度旗下的“飞桨”就是ROCm生态的国产代表。

硬件方面国内的代表性企业有海光信息出品的深算一号、Z100,昆仑K200,华为昇腾910等。硬件方面需要注意,GPGPU不是消费者平时接触的游戏显卡。

国内企业有代表性的:

海光信息(2021年DCU(GPGPU)销售额2.38亿RMB,飞桨已适配80+模型)

摩尔线程(消费级显卡MTT S80(只能玩游戏,不适用于人工智能行业)和服务器计算卡MTT S3000,在2022年完成流片,商业化进程较慢。22年11月飞桨已完成14个模型验证)

沐曦(GPGPU尚未商业化)

壁仞 (GPGPU产品BR100被美国制裁禁止代工,性能参数超过了英伟达A100)

软件适配上,参考百度旗下飞桨官网的说明

这里重点分析上市公司海光信息的DCU(GPGPU),在去年的招股书中,公司有详细的介绍和分析。

性能参数可以看出,海光与英伟达、AMD等国际先进水平还是有一段距离的,不过这个差距比CPU领域要小很多。

一家科技企业要快速达成技术进步,还得看研发投入和营收。

海光的招股书中关于研发投入及同行对比:

海光DCU(GPGPU)芯片销售情况:

其中2021年上半年公司8000系列(DCU)产品实现小规模量产,并在多个行业开展试用,用户反馈效果良好,2021 年下半年 8000 系列产品实现一定规模的销售收入。以上可以看出2021年下半年海光DCU芯片才开始起量,2022年的年报暂未出炉,但可以推测出2022年销售增长最多的应该是DCU芯片,这一点等待验证。

从2018年开始,美国对中国高科技产业的封堵愈演愈烈,出于我国人工智能产业高速发展的担忧美国在2022年正式禁售英伟达、AMD的高端算力芯片(例如英伟达A100),英伟达迫不得已降低性能参数推出中国特供版A800。而国产替代的大背景下,国产算力芯片,软件生态必然是优先考虑的,国产人工智能硬件和软件将是未来的主流。

例如2月1日,国资委召开专题汇报会,其中提到,对国资监管信息化工作提出新要求,要在推动实现国资监管数字化网络化的基础上,在数据、算力、算法上下更大功夫,加快提升国资监管智能化水平。

最后,流浪地球2中出现的超级计算机是中科曙光尚未正式发布的“真家伙”,DCU算力芯片与CPU一起组成了“缸式”浸没液冷计算机。科幻已经不再是科幻,人工智能产业的风口已来,你准备好了吗?(作者霸蛮invest)返回搜狐,查看更多

责任编辑:

© 版权声明

相关文章