【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

ChatGPT办公2年前 (2023)发布 一起用AI
501 0 0

文章来源:天风电子团队

ChatGPT有望带动数据快速增长,AI运算贯穿云-边-端。根据IDC预计,全球数据总量预期2026年将超过221,000 exabyte,2021-2026年年复合增长率达到21.2%,其中非结构化数据占每年创建数据超过90%;透过云、边、终端架构,以数据为中心将算力资源前置,在更靠近数据源的地方为用户提供低时延服务。

云端芯片:AI模型训练核心,计算参数指数级增长重点受益。人工智能的模型自2012年AlexNet问世以来,模型的深度和广度一直在逐级扩升;大规模预训练模型成了一个新的技术发展趋势。根据TrendForce数据,截至2022年统计AI服务器年出货量占整体服务器比重近1%,随着大型云端业者开始大量投入AI相关的设备建设,AI服务器2022~2026年复合成长率有望达到10.8%。

边端芯片:云端与终端的中继站,满足AI轻量化部署需求。根据IDC预测,2025年64%的数据将在传统数据中心之外创建,意味着更智能的处理将在设备上完成,边缘服务器具有体积较小、环境适应性更优、支持多种安装方式、快速前维护和统一管理接口等技术特点。全球边缘AI处理器市场规模近30亿美元,快速响应需求增加有望带动市场规模快速增长。

终端芯片:AIGC应用多点开花,终端AI SoC迎来升级变革。AIGC生成的内容种类越来越丰富,而且内容质量也在显着提升,随着AIGC模型通用化水平和工业化能力提升,有望降低内容生产和交互的门槛和成本。SoC涵盖声音、影像、AI处理,为智能化场景提供完整解决方案,随着终端朝向AI应用发展,SoC成为为智能终端的算力主控。

存储芯片:大数据同步算力提升,AI需求推动市场增长。DRAM方面AI运算需足够的内存带宽,智能化有望带动内存需求提升;NAND方面发展垂直方向堆栈3D NAND层数,新技术注入成长动力。

建议关注:云端AI相关企业:寒武纪、海光信息(天风计算机覆盖)、龙芯中科、紫光国微、复旦微电、安路科技等。边/终端AI相关企业:瑞芯微、晶晨股份、恒玄科技、全志科技、乐鑫科技、富瀚微、中科蓝讯、炬芯科技、兆易创新、中颖电子、芯海科技等。存储相关企业:江波龙(天风计算机联合覆盖)、澜起科技、聚辰股份、北京君正、普冉股份、东芯股份、佰维存储等。AI应用端相关企业:工业富联、大华股份、海康威视等。

风险提示:下游需求不如预期、库存去化不如预期、研发与技术升级不如预期、宏观环境变动带来的风险。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

1. ChatGPT有望带动数据快速增长,AI运算贯穿云-边-端

全球数据总量2021-2026年CAGR达到21.2%,其中以非结构化数据为主。根据IDC预计,全球数据总量预期2026年将超过221,000 exabyte,2021-2026年年复合增长率达到21.2%。数据包括结构化和非结构化数据,但非结构化数据占每年创建数据超过90%。非结构化数据包括视频、照片和图像、语音以及文档等,应用场景包含流媒体、游戏、物联网等应用,其中娱乐和非娱乐图像数据生成占非结构化数据超过56%以上;而处理这种非结构化数据需要更强的计算基础设施。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

云、边、终端混合部署,运算效率有望提升。随着海量数据与运算需求大幅提升,计算能力和连接设备积累了大量数据,透过云、边、终端架构,以数据为中心将算力资源前置,在更靠近数据源的地方为用户提供低时延服务。整体产业链分为上、中、下游:1)上游包括由云服务商和硬件设备厂商,如谷歌、亚马逊、微软、阿里、腾讯等;2)中游主要包括运营商、边缘计算运营和管理的服务提供商;3)下游主要为智能终端和应用。边缘计算产业联盟认为边缘计算是在靠近物或数据源头的网络边缘侧,满足行业数字化在敏捷联接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

边、终端数据创建占比预计25年达到60%以上,AI需求下沉扩大市场空间。根据IDC预测,2025年64%的数据将在传统数据中心之外创建,意味着更智能的处理将在设备上完成,而5G将使来自边缘丰富的数据实时地与其他设备和云共享。互联智能边缘的出现正在加速应用创新的需求,高通预计未来十年内公司潜在的市场扩大七倍多,达到7000亿美元。云计算与边缘计算需要通过紧密协同才能更好地满足各种需求场景的匹配,从而最大化体现云计算与边缘计算的应用价值。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

2022年全球AI芯片市场规模169亿美元,预计未来年复合增长率近30%。根据Precedence Research数据,2022 年全球人工智能AI芯片市场规模估计为168.6 亿美元,预计2030 年达到1351.8亿美元,2022年至2030年的复合年增长率为29.7%;按照类型可以分为GPU、ASIC、FPGA、CPU等,每种芯片类型皆有不同功能;基于处理类型,边缘处理类型细分市场主导 AI 芯片市场,并在 2022 年产生超过75%的收入份额,由于边缘处理在接近数据实际位置的地方进行计算,最大限度地提高了运算效率。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

2025年中国AI芯片市场规模预计超过250亿美金。随着大算力中心的增加以及终端应用的逐步落地,中国AI芯片需求也持续增加。根据亿欧智库预测,2021年中国AI芯片预计达到427亿人民币(按6.9汇率测算,约61.8亿美金),预计市场规模将于2025年达到1780亿元(按6.9汇率测算,约258亿美金)。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

AI芯片中以GPU为主,ASIC、FPGA同步持续增加。根据IDC数据,2021年上半年中国人工智能芯片中,GPU占有90% 以上的市场份额,而 ASIC、FPGA、NPU等其他非GPU 芯片也在各个行业和领域被越来越多地采用,预计到2025年加总的占比有望超过20%。CPU处理复杂的逻辑运算,主要应用于传统的数据中心服务器;GPU具有优秀的图形处理能力,主要应用于图像分类、平安城市、自动驾驶等领域;FPGA可以根据算法逻辑实现特定场景下的计算。因此,FPGA主要应用于深度学习、大数据分析等场景;ASIC主要用于数据推理、辅助驾驶等。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

云、边、终端AI芯片,满足不同算力的应用场。人工智能技术在云端、边缘端和终端设备中均有广泛应用,但都需要由核心芯片提供计算能力支撑。云、边、端三种场景对于芯片的运算能力和功耗等特性有着不同要求,由于云、边、端应用场景尚无标准划分界限,我们以寒武纪招股说明书中自主研发技术体系的数据为例,云端主要需求为高计算密度,因此主流算力大于30 TOPS;终端应用于AIOT场景,主要需求为高效率与低功耗,因此主流算力小于8 TOPS;边缘端应用场景与主流算力介于云端与终端之间。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

1.1. 云端芯片:大模型训练投入提升,算力指数级增长

预训练模型与参数的提升,带动服务器基础设施需求大幅增加。人工智能的模型自2012年AlexNet问世以来,模型的深度和广度一直在逐级扩升,以2018 年的时候BERT-Large(基于 BERT 和 transformer结构的模型)产生之后,兴起了一波模型规模和参数激增的热潮。从BERT模型出现到GPT-3 1750 亿参数规模的千亿级大模型,大规模预训练模型成了一个新的技术发展趋势。根据CNBC报道,以微软Bing为例,基于OpenAI的 ChatGPT模型或需要8个GPU才能在不到一秒的时间内响应问题,按照这个速度测算需要超2万台8-GPU服务器,按照Nvidia DGX A100(八个 A100 GPU 协同工作的系统)建议售价近2万美元测算,需要40亿美元的基础设施支出。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

浮点与大量数据并行计算需求,加速卡成为云端AI处理基础配置。随着智能化程度日益提高,所需的数据处理量正在呈指数级增长;CPU的核心是将其较少数量的核心集中在单个任务上快速完成,擅长逻辑控制、串行的运算;而GPU提供了多核并行计算的基础结构,拥有更高的浮点运算能力且可支撑大量数据的并行计算;因此GPU主要是作为加速某些CPU执行起来效率较低的数据处理任务。以技嘉科技服务器G190-G30为例,除了Intel Xeon E5-2600 v3/v4系列处理器外,另搭载4张支持NVLink内联架构的NVIDIA Tesla P100或V100加速卡。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

AI服务器需求量有望快速增长,预计2022-2026年CAGR 10.8%。根据TrendForce数据,截至2022年统计AI服务器年出货量占整体服务器比重近1%,随着大型云端业者开始大量投入AI相关的设备建设,AI服务器2022~2026年复合成长率有望达到10.8%;2023年全球服务器出货量预计1443万台,同比增长1.31%,AI服务器出货量增速有望高于全球总服务器出货量。我们以浪潮服务器配置为例,通用服务器NF5280M6是基于全新一代英特尔至强第三代可扩展处理器打造,单CPU最高拥有40个内核及80线程,最大支持TDP 270W CPU最高主频3.6 GHz;AI服务器NF5688M6是浪潮为超大规模数据中心研发,同时拥有高性能,高兼容,强扩展的新一代NVLink的AI 服务器。AI优化服务器NF5280M5是专为全新AI应用优化的2U双路机架高端产品,支持第二代智能英特尔至强可扩展处理器,在2U机箱内支持4片GPU加速卡,其高品质、高可靠的表现,适用于一系列高要求的AI应用。

全场景的AI解决方案能使模型训练高效化。人工智能训练随着模型的规模和复杂性不断增加,训练时间相应增加,导致生产力降低和成本增加,完整的解决方案可显著加速AI训练,从而加快模型探索、显着节省成本,因此除了算力以外,核心架构、功耗、内存等参数也是重要的配置指标。此外在运算能力方面,单位TFLOPS (tera FLOPS)为每秒一万亿 (=10^12)次的浮点运算;TOPS为处理器每秒钟可进行一万亿次(10^12)操作。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

1.2. 边端芯片:云端与终端的中继站,满足AI轻量化部署需求

边缘计算具备实时、灵活、降本等特性,数据采集量增加也会提升模型准确性。AI模型可分为两个阶段:1)训练:需耗费大量的运算能力、内存、储存空间等,通常只能放在服务器或是大型工作站进行多次的迭代运算,模型训练完成后可以得到模型的最佳权重;2)推理:当边、终端有新的数据被抓取进来,可以直接通过已训练好的模型进行推论。边缘AI的优势包含灵活性、实时洞察、降低成本、增加隐私、高可用性等特性,去中心化使得处理数据不需要互联网访问,这为关键任务、生产级AI 应用程序带来了更高的可用性和可靠性。此外AI 模型在训练更多数据时会变得越来越准确。当边缘 AI 应用程序遇到它无法准确处理的数据时,它通常会上传数据,以便AI 可以重新训练并从中学习,模型在边缘生产的时间越长,也会使得模型就越准确。AI 算法能够理解语言、视觉、声音、气味、温度、面部和其他非结构化信息的仿真形式,相较于结构化数据更能贴近现实世界,随着神经网络、计算基础设施、物联网设备逐步成熟,催生出边缘AI相关需求。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

边缘AI泛指靠近用户部署轻量服务器,降低数据中心的网路流量与延时。深度学习的训练过程通常在数据中心或云端运行,因为训练准确的模型需要大量数据,而且需要数据科学家协作配置模型;训练结束后,模型即成为推理引擎。在边缘AI部署中,推理引擎在工厂、医院、汽车、卫星和家庭等地区的某种计算器或设备上运行。当AI遇到问题时,数据会上传到云端,以进一步训练原始AI模型,这个反馈回路在提高模型性能方面起着重要作用。边缘有很多定义,但一般来说边缘可以定义为本地系统或在边缘云中预先部署的服务器,而这些服务器与用户的接近程度减轻了遍历数据中心所需的网络流量和延迟。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

全球边缘AI处理器市场规模近30亿美元,快速响应需求增加有望带动市场规模快速增长。由于机器学习创建的数据在设备上处理的需求增加,有望带动边缘人工智能处理器市场快速增长;2022年全球边缘AI处理器市场规模达到29.1亿美元,根据Research Dive数据,预计2025年将达到46亿美元,3年年复合增长率达到16%,预计2030年有望突破90亿美元的规模。边缘AI运算需要实时评估信息的应用程序提供海量数据处理、训练和预测等实时活动进而达到最小的延迟与实时自动决策。以自动驾驶为例,在检测到可能发生的碰撞和改变转向或制动之间是不允许有延迟,设备上的AI减少数据共享可以加快回复速度;以IoT为例,设备将大量数据发送到执行机器学习算法并将结果返回给设备的云,导致延迟响应;这些案例都是推动全球边缘AI处理器市场增长的动力。

边缘服务器就近部署,轻量化实现智能处理增加实时性。边缘服务器具有体积较小、环境适应性更优、支持多种安装方式、快速前维护和统一管理接口等技术特点。边缘计算是在靠近物或数据源头的网络边缘侧,融合网络、计算、 存储、应用核心能力的开放平台,就近提供边缘智能服务,以降低对远端数据中心的流量冲击,有利于计算框架在终端和数据中心间的延展。以浪潮轻量化边缘服务器NE3160M5为例,最大支持 16 核/2.2GHz,最大热设计功率为105W;相比于全场景适配的服务器NF5280M6,最多支持40核/2.3GHz(最高频率3.6GHz(4核)),最大热设计功率270W;具备较强的环境适应性,较适用于AIOT和其他智能边缘应用。随着物联网、5G等新技术的发展,海量数据从边缘端传入边缘计算平台以驱动实时洞察和决策,给存储和网络带宽带来很大的成本和压力。以浪潮边缘微服务器EIS200为例,在不足30W的功耗下支持高达21 TOPS AI 算力,最多支持32路1080高清视频解码与6路编码,支持有线网络、WiFi、ZigBee、4G、5G等多种网络方式,主要面向智慧零售、智能制造、智慧城市和智慧物流等众多边缘AI应用场景。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

随着物联网设备增加,边缘服务器需求有望快速增长。根据ODCC边缘计算白皮书与Omdia调研数据,2019年全球发货的1190万台DC服务器中,有240万台部署在边缘,总收入达147亿美元,同比增加8%。随着物联网连接设备数量的增长,低延迟、多链接、高带宽的新兴业务以及数据本地化安全处理需求,驱动边缘部署服务器的市场持续快速增长,预计2024年边缘服务器的市场份额有望达到28%。部署在边缘环境的服务器形态百花齐放,目前部署在边缘环境的服务器形态主要包括塔式、机架式、刀片式、HCI和开放式计算服务器等。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

1.3. 终端芯片:AIGC应用多点开花,终端AI SoC迎来升级变革

AIGC人工智能内容生成百花齐放,终端交互需求快速增长。AIGC生成的内容种类越来越丰富,而且内容质量也在显着提升,随着AIGC模型通用化水平和工业化能力提升,有望降低内容生产和交互的门槛和成本,在消费互联网领域日趋主流化,实现写作助手、AI绘画、对话机器人等应用。目前AICG在文本、语音、图片生成等应用已初步形成交互场景,但在视频、3D等复杂度较高的领域仍处于探索阶段,AIGC在非结构化数据处理与应用仍有较大的发展空间。根据腾讯研究院与Acumen Research and Consulting预测,2030年AIGC市场规模有望达到1100亿美元。

【深度·天风电子】ChatGPT推动AI芯应用,算力提升终端多点开花

全球物联网连接设备快速增长,各应用领域多点开花。根据GSMA公布的数据,2019年全球物联网连接设备量达到120 亿台,预计到2025年总连接数将会达到246亿台,年复合增长率达13%;根据中国工信部发布的数据,中国物联网连接数占全球的30%,预计2025年将会达到80亿台。从未来6年增量的设备来看,主要增长来自智能家居,包含家电、网络基础设施、安全设备等;智慧建筑包含企业安全自动化、企业资产和设备等。

终端朝向AI应用发展,SoC成为为智能终端的算力主控。AI应用提升产品智能化与用户交互的体验;终端运算包括实时性、数据隐私等优势,且对设备制造商来说,不需要在产品销售的每个区域都布署云基础设施的支持,缩短产品上市的时间。其中底层硬件产品SoC是在一块芯片上集成一整个信息处理系统,拥有整个数字和模拟电路系统的完整功能,主要集成中央处理器、图形处理器、视频编解码器、显示控制器、总线控制器、内存子系统、音频处理器、输入输出子系统以及各类高速模拟接口等功能模块。因此,SoC的电路较为复杂,对研发设计、制造工艺以及软硬件协同开发技术的要求较高,整体流程包含从基础技术的研发到芯片应用的开发最终形成SoC产品。

SoC涵盖声音、影像、AI处理,为智能化场景提供完整解决方案。我们以联发科智能物联网平台 Genio 700为例,该SoC整合高性能八核 CPU,适用于智能家居、互动零售、企业、商业、工业物联网等场景;预计2023年第二季度开始商用。Genio 700 采用高能效6nm制程,八核CPU包含2个主频为2.2GHz的Arm Cortex-A78核心与6个主频为2.0GHz的 Cortex-A55核心,整合的AI加速器可提供 4 TOPs运算性能,可支持深度学习(DL)、神经网络(NN)加速,以及计算器视觉(CV)应用;多媒体方面,拥有4K 60Hz和FHD 60Hz的显示,整合ISP 影像讯号处理器,提供更出色的影像画质。

AI用户需求庞大,终端应用不断落地。以ChatGPT为例,根据Statista与中国工信产业网数据,ChatGPT发布五天用户便超过100万人,发布两个月用户突破1亿,成为史上用户数增长最快的消费者应用。ChatGPT可以生成类人文本的对话式 AI 机器人已被用于各种用途,从编写短篇小说、散文、音乐和学期论文到编写基本代码、解决数学问题和进行翻译。2023年2月微软宣布在新版 Bing 搜索引擎及 Edge 浏览器整合 OpenAI 旗下人工智能技术,可以更容易理解使用者输入的字词,进一步搜寻完整的答案;2023年3月微软宣布,正在透过 Microsoft 365 Copilot 将新一代 AI 强大功能导入生产力工具,也就是在使用 Office 工具,都有一个 AI人工智能助手「Copilot」,帮助用户可以透过对话的方式更有效率完成工作。

1.4. 存储芯片:大数据同步算力提升,AI需求推动市场增长

AI运算需足够的内存带宽,智能化有望带动DRAM需求提升。高性能AI应用中最常见的内存类型包含片上内存、HBM(高带宽内存)和Graphics DDR、SDRAM。SRAM形式的片上存储器是目前可用的最高带宽和最节能的解决方案,但片上存储器的容量低,适用于运行较小的神经网络,或多个芯片之间拆分神经网络协同工作;目前性能最高的两种外部存储器是HBM 和GDDR。HBM是一种新型新型堆栈技术,每个 HBM 堆栈都有1,024条数据线但以低速运行传输数据;GDDR数据线少于HBM,但以更高的数据速率运行。如果处理器没有提供足够的内存带宽,那么架构可能会出现瓶颈,从而阻止计算单元在等待来自内存系统的数据时以最佳性能运行。

NAND Flash发展垂直方向堆栈3D NAND层数。3D NAND层数是目前NAND主要发展方向,主流厂商与现有技术分别为三星176层(V7)、铠侠162层(BiCS6)、美光176层(2nd CTF)、海力士176层(V7)、长江存储的128层Xtacking TLC/QLC。3D NAND的一些技术挑战集中在越来越高的深宽比;2022年三星凭借生产技术、价格和性能竞争力,将NAND Flash堆栈层数从现有基础上增加60层达到236层堆栈,I/O速率达到了2.4Gbps,相较于上一代产品提高1.2倍。国内长江存储通过创新布局和缜密验证,基于晶栈Xtacking研发制造的3D NAND将更具成本和创新优势。

全球存储芯片市场规模达千亿美元但具备较强的周期性。根据WSTS、中商产业研究数据,2017-2021年,全球存储芯片市场规模分别为1240、1580、1064、1175、1538亿美元;其中2019年受下游需求放缓影响导致存储芯片价格下滑,整体市场规模下降;2020年由于下游需求回暖叠加产能紧俏,存储芯片行业恢复增长;2020与2021年存储芯片市场规模同比增速分别为10%、31%;预计2022年存储芯片的销售额为1555亿美元,同比增长1.1%;从中长期来看,根据Yole数据2021-2027年全球存储芯片行业市场规模的复合年增长率为8%,并有望在2027年增长到2600亿美元以上,但产业会随库存、需求、产能的变化而具有明显的周期性。全球存储类芯片市场中以DRAM和NAND Flash为主,2021年市场规模占整体存储芯片市场规模的比例分别为56.4%和40.1%,DRAM和NAND Flash合计占比约为96.5%。

随着全新处理器相继推出有望带动存储需求持续向上。手机方面联发科天玑9200旗舰移动平台具有高性能、高能效、低功耗表现为旗舰市场打造新旗舰标杆,率先采用Armv9 性能核,搭载Cortex-X3 超大核(主频高达 3.05GHz)及Cortex-A715 大核(主频高达 2.85GHz),存储支持LPDDR5x、UFS 4 + MCQ;服务器市场,2022年11月AMD发布EPYC 9004系列处理器Genoa,支持DDR5-4800内存;英特尔2023年1月发布的第四代Xeon Scalable系列处理器Sapphire Rapids,采用 10纳米Enhanced SuperFin(Intel 7)制程技术生产;新平台还支持PCIe Gen5、CXL 1.1(Compute Express Link)和8信道DDR5内存。

2. 建议关注

云端AI相关企业:寒武纪、海光信息(天风计算机覆盖)、龙芯中科、紫光国微、复旦微电、安路科技等。边/终端AI相关企业:瑞芯微、恒玄科技、晶晨股份、全志科技、乐鑫科技、富瀚微、中科蓝讯、炬芯科技、兆易创新、中颖电子、芯海科技等。存储相关企业:澜起科技、聚辰股份、北京君正、普冉股份、东芯股份、江波龙(天风计算机联合覆盖)、佰维存储等。AI应用端相关企业:工业富联、大华股份、海康威视等。

3. 相关风险

下游需求不如预期:下游市场需求如发生重大不利变化,或影响产品推广使市场规模下滑。库存去化不如预期:如出现不可预测的市场需求的较大变化,导致市场需求出现下降,则可能出现一定的存货风险。研发与技术升级不如预期:随着产品换代、技术升级、用户需求和市场竞争状况不断演变,AI相关产品研发及技术更新换代不如预期或影响整体产业发展。宏观环境变动带来的风险:受贸易政策、宏观经济形势等因素影响,全球经济和半导体产业发展注入了新的不确定性和风险。

© 版权声明

相关文章