每日经济新闻

    AI芯片厂商掀IPO热潮,谁能成为下一个“寒武纪”?

    每日经济新闻 2025-01-21 19:02

    2024年8月至2025年1月,国内四家AI算力厂商陆续启动IPO辅导,其中三家为GPU路线,一家为ASIC路线。这些企业在技术和团队方面各有优势,如燧原科技和沐曦股份创始团队有AMD背景,摩尔线程创始团队来自英伟达。当下GPU仍是市场主流,但未来随着AI技术落地,推理市场规模或超训练环节,而ASIC在推理领域潜力巨大。

    每经记者 朱成祥    每经编辑 杨夏    

    2024年,AI浪潮持续翻涌,寒武纪(688256.SH,股价625元,市值2609.1亿元)作为A股AI算力芯片龙头可谓风头无两,Wind数据显示,去年寒武纪股价上涨387.55%,同期科创100指数则下跌8.56%。

    在寒武纪“独领风骚”的二级市场之外,国内还有一批优秀的AI算力芯片企业尚未登陆资本市场,如壁仞科技、天数智芯、燧原股份、摩尔线程、沐曦等。其中,壁仞科技、燧原股份、摩尔线程、沐曦目前已进入上市辅导阶段。

    AI算力芯片主要可以分为GPU(图形处理器)、AI ASIC(人工智能专用处理器)和FPGA(现场可编程门阵列)三种。目前,国内GPU厂商代表有壁仞科技、天智数芯、摩尔线程和沐曦等;AI ASIC厂商代表有华为海思昇腾、燧原股份、地平线、黑芝麻智能、比特大陆等。


    AI算力芯片分类 图片来源:记者根据公开信息整理,Napkin AI制图

    尽管位列Wind GPU指数(8841701.WI)成分股,但根据寒武纪招股书,其将自己的产品与传统芯片CPU、GPU等进行了区分,称“主要研发通用型智能芯片”,而不是专用型智能芯片(ASIC)。不过,在多家券商和咨询机构的研报中,均将其产品列为了ASIC。

    GPU与ASIC芯片到底是什么?

    根据国泰君安证券研报,AI芯片主要分为三种类型:通用型(GPU)、半定制型(FPGA)、定制型(ASIC)。三类芯片代表分别有英伟达(NVIDIA)的GPU、赛灵思的FPGA和Google的TPU(一种专门为机器学习任务设计的AI ASIC)。GPU的计算能力最强,但是成本高、功耗高;FPGA可编程,最灵活,但是计算能力不强;ASIC体积小、功耗低,适合量产,但是研发时间长,且不可编辑,前期投入成本高,带来一定的技术风险。

    三大AI算力芯片特点 图片来源:记者根据公开信息整理,Napkin AI制图

    在寒武纪招股书中,将自己的产品与传统CPU、GPU等芯片类型进行了区分,而是列为通用型智能芯片和专用型智能芯片(ASIC)两类。其中,通用型智能芯片代表包括寒武纪思元100/270/220)、华为海思(Ascend 310/910)、谷歌(TPU V1/V2/V3、TPU EDGE)等。

    图片来源:寒武纪招股书

    在国泰君安证券研报中,谷歌TPU、华为海思昇腾910均被分类为ASIC。此外,燧原股份的云燧T20与寒武纪的NPU在整体性能上也与谷歌比肩。

    此外,民生证券研报显示,云端算力中,寒武纪也被划入了ASIC。

    头豹研究院AI行业高级分析师常乔雨也告诉《每日经济新闻》记者:“目前国内从事AI ASIC研发的厂商主要包括寒武纪、地平线、燧原科技、黑芝麻智能和比特大陆等。”

    不过,寒武纪、燧原科技的芯片可能更偏向于DSA(领域专用架构),不属于传统不可编程的ASIC,而是广义的ASIC。

    传统ASIC不可编程,于是DSA应运而生。常乔雨表示:“DSA芯片在性能和灵活性之间找到平衡点,成为ASIC和GPGPU(通用图形处理器计算)之外的另一条技术路径。DSA结合了ASIC的高性能优势和GPGPU(通用图形处理器)的编程灵活性,专为特定领域的计算需求设计,尤其适用于泛安防和自动驾驶等明确场景。”

    他补充表示:“整体来看,ASIC、GPGPU和DSA各有侧重:ASIC注重特定任务的极致性能,GPGPU强调通用性,而DSA则尝试去结合两者的优点,带来性价比和效率更高的算力。”

    燧原股份相关工作人员也回复《每日经济新闻》记者称:“我们是DSA架构。”

    黑芝麻智能也对记者表示:“黑芝麻智能的芯片架构兼具ASIC的高性能和GPGPU的灵活性,芯片产品可以归为ASIC芯片类别,和以上芯片(寒武纪、华为海思昇腾、燧原科技)架构类似,都具备灵活编程的扩展性。”

    简而言之,DSA属于广义ASIC芯片,且较传统ASIC更加灵活。

    四大AI算力厂商启动IPO辅导

    2024年8月以来,国内四大AI算力厂商陆续启动IPO辅导。2024年8月26日,AI ASIC领域代表厂商燧原科技启动IPO辅导;GPGPU领域代表厂商壁仞科技于9月11日启动IPO辅导;11月12日,GPU厂商摩尔线程启动IPO辅导。

    进入2025年,1月15日,沐曦股份也启动了上市辅导。若四家全部上市成功,将大幅扩展A股AI算力厂商投资标的的供给。

    这几家接受IPO辅导的企业中,燧原科技创始团队有AMD背景,其创始人兼COO张亚林于2008年加入AMD,历任资深芯片经理、技术总监。曾经作为全球芯片研发主要负责人之一,在AMD上海研发中心成功领导开发并量产了多颗世界级芯片,拥有丰富的工程和产品化实战经验。

    沐曦股份创始团队同样来自AMD,其创始人陈维良曾任AMD全球GPGPU设计总负责人;两位CTO(首席技术官)均为前AMD首席科学家,目前分别负责公司软硬件架构。

    而摩尔线程创始团队来自全球GPU巨头英伟达,其创始人兼CEO张建中曾任英伟达全球副总裁、中国区总经理,在GPU这一行业已经深耕近二十年。

    图片来源:视觉中国(图文无关)

    除了这四家接受IPO辅导的厂商外,天数智芯、昆仑芯、平头哥等厂商也广受市场关注。

    另外,目前接受IPO辅导的四家厂商中,三家属于GPU路线,一家属于ASIC路线。当下,以英伟达为代表的GPU算力厂商仍是市场主流,而近期以博通为代表的ASIC路线也逐渐受到广泛关注。

    对于GPU路线与ASIC路线的优劣,TrendForce集邦咨询分析师邱珮雯回复《每日经济新闻》记者认为:“ASIC在可见的未来不会完全取代GPU,ASIC通常是专门为某种特定应用或运算去设计的芯片,如训练或推理,偏向特定客户定制化;而GPU设计为通用运算,对于执行多样任务较具灵活性,通常为标准品,适用于多数客户,且相较于高阶英伟达芯片如B200,ASIC目前开发运算效能落差仍大。因此,ASIC和GPU有各自的目标市场及应用。”

    常乔雨认为:“当前,AI ASIC的应用主要集中在推理任务上,尽管部分产品也涉及训练领域,但推理显然是其核心战场。这是因为推理任务具有固定的计算模式和高吞吐量需求,非常契合ASIC硬件固化的高效特性。与此同时,推理的市场空间未来也将显著超过训练。随着人工智能技术在各行业的加速渗透,终端设备和云端推理的需求量快速增长,涵盖了从智能家居到工业自动化再到车载计算的多样化场景。而推理任务的高频调用和长生命周期特点,也决定了这一市场的规模潜力将远超一次性投入较高的训练环节。”

    也就是说,当下AI仍以训练为主导,GPU仍是主流。而未来,随着AI技术的广泛落地,推理市场规模或大幅超过训练环节。而推理环节,正是AI ASIC的主战场。

    事实上,ASIC芯片不仅在推理领域潜力巨大,在类似智驾等特定场景的应用也前景广阔。

    黑芝麻智能方面告诉《每日经济新闻》记者:“黑芝麻智能的智驾芯片在高性能、低功耗、灵活性、跨域融合、市场定位和端到端算法参考模型等方面都有显著优势。由于黑芝麻智能智驾芯片面向特定场景,因此算力的利用率、能效比都会更高。在灵活性方面,黑芝麻智能的芯片设计融入了可编程性,使其在一定程度上具备GPGPU的灵活性。”

    如何补“运力”短板?

    目前,国际上主流AI ASIC厂商为博通、Marvell。需要注意的是,博通不仅拥有AI ASIC设计能力,其配套网络业务也十分强大,比如以太网交换芯片、PCIe/CXL Retimer等。而英伟达算力领域的三大壁垒,包括GPGPU芯片、NVLink和CUDA生态。而国内厂商在软件工具链和开发者生态方面尚待补强。

    根据国联证券研报,AI大模型的快速发展推动“算力”“存力”需求快速增长。与此同时,对“运力”也提出了更高的需求。系统需要更高的带宽,更快的传输。但内存的性能提升速度远低于处理器的性能提升速度,导致处理器无法充分发挥其计算能力。

    英伟达有NVLink,博通有CXL技术,那么国内在“运力”领域有哪些布局呢?

    国内CXL高速互联厂商国数集联告诉《每日经济新闻》记者:“NVLink具备高带宽和低延迟的优点,但存在生态封闭、价格昂贵等问题。主要运用在英伟达产品中。CXL基于PCIe的基础上发展而来,专注于优化处理器与加速器之间的通信。CXL能够提供高带宽、低延迟的通信,并支持先进的大容量低延迟内存协同特性。CXL也是唯一横跨运力和存力的互联标准、唯一横跨通用服务器和AI服务器的互联标准。”

    目前国内也有较多的AI ASIC厂商。那么,国数集联在高速互联领域有哪些独特的优势,是否有意与AI算力芯片厂商合作,共同研发、拓展市场?

    国数集联表示:“公司面向人工智能数据中心(AIDC)、云服务商、服务器厂商以及运营商,提供先进的高速互联算法、芯片及方案。目前,公司的核心产品包括CXL Switch芯片、模块以及硬件整体方案。国数集联正与国内的云厂商、AI厂商、运营商展开合作,旨在提供高效的数据传输和联结方案。”

    图片来源:视觉中国(图文无关)

    异构计算会是未来吗?

    大模型发展迅速,也对各大厂商软硬件结合能力提出更高要求。而国内不少GPGPU厂商,也开始走向“异构计算”。

    天数智芯副总裁邹翾对《每日经济新闻》记者表示:“异构计算在训练和推理领域都占据着重要地位。在训练领域,面对大规模数据集和复杂模型结构,单一类型芯片往往难以满足计算需求。异构计算通过整合多种不同架构芯片,可以加速训练过程,减少训练时间和成本。在推理领域,实时性要求极高,异构计算能够根据不同的推理任务特性,灵活调配硬件资源。例如在处理图像、语音等特定类型数据时,通过不同芯片的协同工作,快速完成推理,输出准确结果。”

    资料显示,天数智芯是国内率先支持智算芯片混合训练的通用GPU厂商。其“天垓”和“智铠”产品系列,广泛应用于主流大模型的训练、微调以及推理任务。2024年,天数智芯参加了在上海市通信管理局和上海市数据局的支持下,多家单位联合开展的跨域异构算力网络实验验证工作,异构混训效率可达97.5%。

    壁仞科技向记者提供的资料也显示,公司正联合客户、合作伙伴、科研机构共同推动异构GPU协同训练生态,具体包括:中国移动、中国电信、中兴通讯、商汤科技、国网智能电网研究院有限公司、上海智能算力科技有限公司、上海人工智能实验室、中国信息通信研究院等。

    壁仞科技表示,这一异构GPU协同训练方案最终实现了国产GPU和英伟达GPU的异构共存,突破异构算力孤岛难题,加快国产GPU的落地迁移,助力国产大模型落地。此外,该方案赋能整个算力产业发展,壁仞HGCT方案具备普适性、易用性、兼容性,助力最终客户实现多种异构算力聚合,最大化异构GPU集群利用效率。

    图片来源:视觉中国(图文无关)

    在边缘侧,AI PC又将如何发展呢?未来AI算力芯片是否可能作为单独的“外挂”芯片,类似于独立显卡搭配在AI PC之中?

    天智数芯表示:“目前这种外挂AI芯片的AI PC已有原型,并且已经有用户在使用。随着AI在PC端应用场景不断拓展,如智能创作、数据分析等,对算力需求剧增。将AI算力芯片做成‘外挂’,便于用户根据自身需求灵活升级,提升AI性能,就像现在人们按需选择独立显卡。同时,这也有助于降低PC整体成本,促进AI技术在PC领域的普及。”

    可以看出,除了寒武纪外,国内未上市的企业中,也有较多GPGPU厂商、AI ASIC厂商,且在“运力”、软件生态领域,国内厂商也在积极布局。

    封面图片来源:视觉中国-VCG41N970174988

    版权声明

    1本文为《每日经济新闻》原创作品。

    2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。

    上一篇

    工信部:2024年41个工业大类行业中39个保持增长,电子、有色、化工、汽车等行业对工业生产增长贡献率超四成

    下一篇

    2连板广西广电:公司已披露的重大资产置换事项尚处于筹划阶段



    分享成功
    每日经济新闻客户端
    一款点开就不想离开的财经APP 免费下载体验