赛道Hyper | AMD连续收购强化AI布局
作者:周源/华尔街见闻
6月5日和之前一日,AMD次第宣布连续完成两笔战略收购:以未公开条款收购开源软件公司Brium,以及从AI推理芯片开发商Untether AI收购核心工程师团队。
这两笔交易是AMD继2023年收购Mipsology、Nod.ai及2024年收购Silo AI后的最新动作,标志着AMD构建全栈AI解决方案的战略进入新阶段。
AMD的这两笔交易,旨在构建“芯片-软件-系统”三位一体的竞争力。
Untether AI的芯片设计能力强化了AMD在边缘计算和数据中心的硬件实力,而Brium的软件优化能力,填补了AMD在推理环节的生态短板。
这种“软硬兼施”的策略与AMD此前收购Mipsology(编译器)、Nod.ai(框架适配)等公司的逻辑一致,目的都是形成完整的AI技术栈。
Brium的核心技术是优化AI推理软件在不同硬件架构上的运行效率。
该公司更重要的技术路线主要集中在云端AI软件生态,工具被集成到PyTorch官方插件库,开发者可通过简单配置,实现AMD硬件加速。这种开源策略有助于吸引更多开发者使用AMD平台,逐步打破英伟达 CUDA的垄断地位。
换句话说,Brium开发的工具可将原本针对英伟达 GPU设计的AI模型适配到AMD Instinct GPU等平台,解决“工作负载通常根据英伟达 GPU做广泛调整”的行业痛点。
这一技术能力对AMD具有战略价值:当前全球超过80%的AI软件基于英伟达 CUDA生态开发,而AMD Instinct MI300X等硬件虽在算力参数上接近英伟达 H100,但实际部署时性能释放不足50%。
此次收购Brium,是AMD构建开放AI软件生态的重要一环。
自2023年以来,AMD通过收购Mipsology(Zebra编译器)、Nod.ai(Shark抽象层)和Silo AI(大模型开发团队),已形成覆盖编译器、框架适配、模型训练的完整软件栈。
Brium被纳入AMD阵营,将进一步强化AMD在设计AI加速卡时推理环节的优化能力,帮助开发者实现“一次开发、多平台部署”,由此降低对英伟达硬件的依赖。
值得注意的是,Brium的技术路线与AMD近期推出的ROCm 6.0框架能形成互补。问题是,ROCm 6.0引入新的自动调优工具,但在跨硬件兼容性上仍存在局限。
Brium的解决方案,可在保持模型精度的前提下,将推理延迟降低30%+,尤其在医疗影像分析、金融风控等对实时性要求高的场景中具有显著优势。
Untether AI的核心价值在于其具有低功耗、高性能的AI推理芯片技术。
该公司为通用汽车、梅赛德斯-奔驰等车企开发的芯片,在自动驾驶感知系统中实现了比竞品快2倍、节能40%的技术性能。
通过动态资源分配,独特的空间架构(Spatial Architecture)可在边缘设备上高效运行复杂的视觉Transformer模型,同时支持企业数据中心的高密度部署。
此次被AMD收购的工程师团队,将直接增强AMD两项技术能力:一是AI编译器开发,Untether AI在动态编译和内核优化方面的经验,能提升AMD硬件的软件适配效率;二是SoC设计,被收购团队曾主导开发过集成AI加速器的车规级芯片,有助于AMD拓展自动驾驶和工业物联网市场。
连续收购反映了AMD从“硬件供应商”向“AI解决方案提供商”的转型。
通过整合Brium的软件优化能力和Untether工程团队的芯片设计经验,AMD正在构建“芯片-软件-系统”三位一体的竞争力。
这一战略在其2024年收购ZT Systems(数据中心基础设施公司)时已初现端倪:通过将硬件、网络和系统集成能力纳入自身体系,AMD得以与英伟达的DGX系统直接竞争。
在技术层面,AMD的全栈布局聚焦两大方向:一是通过开源生态吸引开发者,如Brium的工具已集成到PyTorch官方插件库,开发者可通过简单配置实现AMD硬件加速;二是优化边缘-云端协同,Untether的芯片支持与AMD MI300X GPU的混合部署,在智能工厂场景中能大幅降低整体推理延迟。
当前AI芯片市场仍由英伟达主导,其数据中心GPU市占率高达75%,且采用Blackwell架构的新品B200在推理性能上领先AMD MI325X两倍以上。
AMD的应对策略是“差异化竞争”:在高端市场,通过MI300X的1.5TB HBM容量抢占大模型单节点部署场景;在边缘市场,借助Untether的低功耗技术,快速切入自动驾驶、工业机器人等领域。
开源生态的构建是AMD破局的关键。
通过收购Brium 等公司,AMD已将ROCm框架的开发者数量提升至20万,较2023年增长300%。但这个数量与英伟达CUDA的200万开发者基数相比,差距依然非常大。
因此,AMD需在工具链成熟度、文档支持等方面持续投入,像Brium在博客中提到其工具仍需手动调整环境变量才能达到最佳性能,这一问题亟待解决。
巨头收购,通常会带来整合不力的问题,比如英特尔就是,数次大规模收购都没能带来预期中的正向反馈。因此,连续收购对AMD的整合能力也提出了考验。
2022年,AMD收购Xilinx后,AMD花了18个月才完成产品线协同,而Brium和Untether的团队分散在多个国家,文化差异和技术路线整合可能影响在组织和商业上的进度。
此外,AMD在一季度研发支出达17.3亿美元,其中约30%用于软件生态建设,但与英伟达同期58亿美元的研发投入,差距明显。
除了组织和文化整合,能否取得预期中的市场验证,也是AMD面临的另一大挑战。
AMD MI325X虽在硬件参数上领先,但实际部署中因软件问题导致性能仅达标称值的60%,客户更倾向选择英伟达B200。
Brium和Untether的技术能否在2025年底前显著改善这一状况,将决定AMD能否在AI芯片市场实现份额突破。