赛道Hyper | 联想新服务器将搭载英伟达Blackwell
作者:周源/华尔街见闻
在2024Tech World上,联想集团董事长兼CEO杨元庆和英伟达CEO黄仁勋联合宣布,联想ThinkSystem服务器系列中的SC777型号,将搭载NVIDIA(英伟达) Blackwell Al加速卡(GPU)。
今年3月18日,在GTC(GPU Technology Conference)2024上,联想集团与NVIDIA宣布合作推出全新混合人工智能解决方案,帮助企业和云提供商获得在人工智能时代成功所需的关键的加速计算能力,将人工智能从概念变为现实。
同时,在大规模高效增强人工智能工作负载方面,联想在那时发布了ThinkSystem人工智能产品组合的扩展,其中包括两款8路NVIDIA GPU系统。
联想ThinkSystem服务器系列是联想旗下的数据中心基础设施产品,包括多种型号,主要针对不同的企业级应用和服务。这个系列目前已知的型号分为SC和SR。
其中,SR已推出多种类型的产品,但SC目前只有SC777,关键功能包括支持大规模计算集群,极佳的扩展性和可配置性,使其适用于各类企业场景。
从数据中心的高效能计算到边缘计算场景,联想ThinkSystem SC777灵活的架构与优异的能效比使SC777能适应多种动态变化的业务需求。此外,这款服务器的安全性设计也极为出色。
ThinkSystem SC777服务器能在复杂的AI训练、图像处理和视频分析等任务中快速运行,并且通过高度灵活的配置,能迅速适应不同的工作负载需求。
Blackwell是NVIDIA推出的新一代AI芯片与超级计算平台,得名于美国数学家David Harold Blackwell。这个架构的 GPU 具有 2080 亿个晶体管,采用专门定制的台积电4NP工艺制造。所有 Blackwell 产品均采用双倍光刻极限尺寸的裸片,通过 10 TB/s 的片间互联技术连接成一块统一的 GPU。
第二代Transformer引擎将定制的Blackwell Tensor Core 技术与NVIDIA TensorRT-LLM和NeMo框架创新相结合,加速大语言模型(LLM)和专家混合模型(MoE)的推理和训练。
为了强效助力MoE模型的推理Blackwell Tensor Core增加了新的精度(包括新的社区定义的微缩放格式),可提供较高的准确性并轻松替换更大的精度。
Blackwell Transformer引擎利用称为微张量缩放的细粒度缩放技术,优化性能和准确性,支持4位浮点(FP4)AI。这将内存可以支持的新一代模型的性能和大小翻倍,同时保持高精度。
Blackwell内置NVIDIA机密计算技术,可通过基于硬件的强大安全性保护敏感数据和AI模型,使其免遭未经授权的访问。这也是业内首款具备可信执行环境(TEE)I/O功能的GPU,不仅能与具备TEE-I/O功能的主机一同提供性能卓越的机密计算解决方案,还能通过NVIDIA NVLink技术提供实时保护。
总的来说,Blackwell GPU是英伟达推出的下一代加速计算和生成式人工智能(AI)的核心平台,采用全新架构设计,搭载六项变革性的加速计算技术。
这些技术将助推数据处理、工程模拟、电子设计自动化、计算机辅助药物设计、量子计算和生成式AI等领域实现突破。特别值得一提的是,其AI推理性能比前一代产品提升30倍,而能耗却降低25倍,这对于AI和计算领域来说是一个巨大进步。