“国产GPU第一股”之战已经打响。

作为“国产GPU四小龙”的摩尔线程智能科技(北京)股份有限公司(下称“摩尔线程”)、沐曦集成电路(上海)股份有限公司(下称“沐曦集成”)科创板IPO均已先后获得受理。

同时,GPU大厂壁仞科技、燧原科技、格兰菲智能科技股份有限公司则处于IPO辅导阶段。

这意味着,“国产GPU四小龙”都踏上了资本化之路。

其中摩尔线程无疑是最为受瞩的存在。

摩尔线程的核心团队成员基本来自英伟达,旗下的MTT S80显卡的单精度浮点算力性能接近英伟达RTX 3060,自建的千卡GPU智算集群效率超过同等规模国外同代系GPU集群。

2024年,摩尔线程收入已经达到4.38亿元,同比增长了超2倍。

但由于同期研发费用仍达到13.59亿元,造成的净亏损仍达到14.92亿元,但同比已减亏1成左右。

摩尔线程计划募资80亿元,投向AI训推一体芯片、图形芯片和AI SoC 芯片的研发。

这是今年上半年科创板新增IPO项目中最大的一笔募资规模。

同期获得受理的沐曦集成IPO募资额只有摩尔线程的一半左右。

谁将成为“国产GPU第一股”,市场正在翘首以待。

从产品布局来看,摩尔线程属于“全能型选手”。

品类涵盖AI智算、专业图形加速、桌面级图形加速和智能SoC,可以满足政府、企业和个人消费者的需求。

AI智算类产品包括训练智算卡、推理卡、超节点服务器及夸娥智算集群等。

该大类产品在2024年首度实现零突破,创收3.36亿元,占比超过7成。

这一方面受益于市场对大模型训练、推理部署等场景的需求快速增长;

另一方面,这和产品落地时间有关。摩尔线程直到2023年才推出可提升AI训练和推理能力的第三代GPU芯片,并基于此搭建了千卡集群智算中心。

目前摩尔线程的代表性产品之一MTT S4000,正是在2023年底推出的训推一体全功能智算卡。

虽然MTT S4000和英伟达的H100仍存在较大的差距,但摩尔线程已经对其进行迭代,并在此次招股书中首度披露新品“MTT S5000”对标H100的粗略数据情况。

摩尔线程称MTT S5000可通过FP8精度支持等创新提升性能。

其中,FP(Floating Point)是标准浮点数类型。作为衡量算力性能的指标之一,FP一般可分为FP8、FP16、FP32等,FP标注数值与精度成正比。

在终端场景的应用中,虽然精度越高会带来更高的准确性,但同时还会带来能耗、内存、计算效率的压力。

理想的目标是保持低精度的同时还能实现准确性、效率、内存、能耗的平衡。

FP8是目前深度学习领域较为新型的低精度浮点格式之一。虽然FP8相较于此前的FP32格式精度较低,但部分企业目前通过特殊处理已经可以实现以微小的精度损失换来高效的运算和更低内存占用。

例如DeepSeek V3便引入了FP8混合精度训练框架,首次在超大模型验证了其有效性。

“通过支持FP8计算与存储,我们既实现了训练加速,又降低了GPU内存占用。”DeepSeek团队在V3开源报告中指出,“与BF16基线相比,我们FP8训练模型的相对损失误差始终保持在0.25%以下,这个水平完全在训练随机性的可接受范围内。”

不过目前摩尔线程仅披露MTT S5000在FP32指标中与国际大厂的差异。

MTT S5000的FP32算力性能为32TFLOPS,高于英伟达A100的19.5TFLOPS,但低于英伟达H100、AMD的MI325X,二者分别为67TFLOPS、163.4TFLOPS。

尽管FP32不是唯一的性能指标,但可以看出MTT S5000的算力性能较上一代的MTT S4000已有所升级,后者的FP32仅为25TFLOPS。

不仅如此,摩尔线程基于MTT S5000还构建了千卡GPU智算集群,效率超过同等规模国外同代系GPU集群。

此番IPO,摩尔线程的目标之一就是投资25亿元新建“新一代自主可控AI训推一体芯片研发项目”,包括引入先进工艺、先进封装等,预计建设周期为3年。

市场期待更多商业化成果可以得到实现。

尽管品类涵盖B端和C端,但摩尔线程目前整体的收入规模仍不敌沐曦集成。

2024年,摩尔线程4.38亿元的收入仅为沐曦集成6成左右。

这或许和二者的商业化策略差异有关。

摩尔线程聚焦全功能GPU产品的开发,即兼具功能完备性与精度完整性。

一方面,摩尔线程的单一GPU集成了AI计算加速、图形渲染、物理仿真和科学计算等多种功能;

另一方面,GPU还支持FP64、FP32 等不同计算精度,满足终端场景的个性化需求。

虽然B端和C端两手抓,但摩尔线程在开拓C端市场上略显“吃力”。

摩尔线程推出的 MTT S80/S70系国内首款消费级GPU产品,可以兼容多款游戏。其中MTT S80的FP32算力性能接近英伟达的RTX 3060。

但2022年至2024年,包括MTT S80/S70等消费级GPU等在内的桌面级图形加速产品收入合计仅为0.72亿元。

不仅如此,由于这类产品市场竞争激烈,导致摩尔线程不得不采取低价策略——2023年、2024年单价分别仅为537.52元、884.61元。

这甚至无法覆盖成本。同期毛利率分别为-103.74%、-15.87%。

“桌面级图形加速产品毛利率为负,主要由于中低端市场面临国际品牌的激烈竞争,导致公司产品销售价格存在一定压力。”摩尔线程指出。

相比之下,沐曦集成的GPU主要聚焦市场增长较快的人工智能训练和推理、通用计算与图形渲染领域,集中在B端市场,商业化成果兑现较快。

面对商业化进展迟缓的消费级产品,摩尔线程正在转变自己的策略,更加聚焦于专业图形加速、AI智算的B端产品。

“面对国际知名公司的成熟产品,公司芯片、板卡产品销售价格存在一定压力。随着产品不断发展,公司逐步拓展专业图形加速、AI智算等高性能、高毛利领域产品,毛利率逐渐上升。”摩尔线程指出。

摩尔线程在专业图形加速、AI智算领域确实能够斩获更为可观的毛利,2024年AI智算、专业图形加速的板卡毛利率分别高达90.7%、83.13%。

同期,沐曦集成的训推一体、智算推理的板卡毛利率则分别为63.5%、10.09%。

随着商业策略的转变,摩尔线程有望迎来扭亏时刻。目前管理层预计最早可在2027年实现盈利。

已披露金额的在手订单中,摩尔线程已有4.4亿元销售合同正在履行中。

市场期待摩尔线程能够早日在终端市场占有一席之地。

风险提示及免责条款
市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。