美国国家实验室转向新兴芯片初创公司以应对高精度计算芯片短缺
近年来,随着人工智能(AI)技术的快速发展,主流芯片巨头如英伟达(NVDA.US)和AMD(AMD.US)将研发重心和产能向AI低精度计算倾斜,导致美国国家实验室难以采购到满足高精度科学计算需求的芯片。桑迪亚国家实验室,作为美国三大负责核武器研发与维护的实验室之一,开始测试以色列初创公司NextSilicon的芯片,以寻求突破供应链困境的新路径。
桑迪亚实验室高性能计算团队主管Steve Monk表示,随着主流芯片公司日益将产品设计向AI倾斜并面临供应链短缺,实验室在获取满足其高精度科学计算需求的芯片方面承受着越来越大的压力。
双精度浮点计算(FP64)的重要性
核心分歧在于一项被称为“双精度浮点计算”(FP64)的技术指标。对于核武器物理模拟等科学计算而言,芯片需要能够在不损失精度的情况下同时处理极大和极小的数值。FP64是维系现代飞机飞行、火箭升空、疫苗研发乃至核武器正常运作的关键技术,能够表达超过18.44万亿亿个唯一数值,是科学计算领域的“黄金标准”。相比之下,现代AI模型通常使用FP8精度进行训练,仅能表达256个唯一值。
| FP64与FP8对比 | FP64 | FP8 |
|---|---|---|
| 唯一数值表达能力 | 超过18.44万亿亿个 | 256个 |
英伟达最新发布的Rubin GPU虽然在AI算力上实现了质的飞跃——推理速度达到50 petaFLOPS,是上一代Blackwell的2.5倍——但其FP64峰值性能约为33 teraFLOPS,实际上比四年前推出的H100还要低1 teraFLOPS。
初创公司NextSilicon的崛起
芯片巨头的战略调整,正在为NextSilicon等新锐企业打开市场空间。这家成立于2017年的以色列初创公司,经过八年研发,已累计完成约3.03亿美元的种子轮及三轮风险融资,估值一度达到约15亿美元。
与英伟达和AMD基于GPU或CPU的传统技术路线截然不同,NextSilicon的旗舰芯片“Maverick-2”采用智能数据流架构,能够通过软件定义的数据流硬件实现运行时动态重构与优化,芯片可实时重新编程以更高效运行。在电力效率方面,数据流架构减少了数据在计算系统内存之间来回搬运的时间和能耗。
桑迪亚国家实验室负责测试新型计算架构项目的高级科学家James Laros对此给出了高度评价:“NextSilicon的性能结果令人印象深刻,展现出在无需大量代码修改的情况下提升计算能力的真正潜力。”
周一,桑迪亚国家实验室、NextSilicon以及帮助将NextSilicon芯片集成到超级计算机中的Penguin Solutions联合宣布,搭载NextSilicon芯片的超级计算机系统已通过一系列通用超算测试的关键技术里程碑,使其有资格在今年秋季进一步接受更贴近核安全实际工作的高难度计算任务测试。
Laros表示,实验室积极携手NextSilicon这类中小芯片企业,核心目的是构建多元化芯片采购体系,即便头部芯片企业战略赛道转移,也能持续稳定获取适配科研任务的算力芯片。“我们必须保持可用的选择来完成使命,因为这项使命没有退路,”Laros强调。