电子报阅读机
2026-03-22
星期日
当前报纸名称:南京晨报

AI算力市场格局或被重塑

日期:03-06
字号:
版面:第A12版:财经周刊       上一篇    下一篇

3月16日至19日,英伟达GTC大会将在美国加州圣何塞举行,公司首席执行官黄仁勋表示,将在大会上揭晓“前所未见”的全新芯片,外界预测该芯片为一款整合了Groq“语言处理单元”(LPU)技术的全新推理芯片。据华尔街日报报道,这款被黄仁勋称为“世界从未见过”的全新系统,专为加速AI模型的查询响应而设计。

南京证券研究员高宏分析表示,该产品的推出预计将重塑当前的AI算力市场格局,直接影响正在寻找更具成本效益替代方案的云服务提供商和企业级投资者。

算力升级仍在继续

高宏表示,作为市场对该技术初步认可的重要标志,ChatGPT开发商OpenAI已同意成为该新处理器的最大客户之一,并宣布将向英伟达购买大规模的“专用推理产能”。这一举动不仅稳固了英伟达的核心客户盘,也向市场发出了明确信号:支持自主AI智能体的底层基础设施正从大规模预训练转向高效推理。在面临谷歌、亚马逊以及众多初创公司激烈竞争的背景下,英伟达正在突破传统图形处理器(GPU)的单一依赖。

随着AI行业从模型训练向实际应用部署转移,推理计算成为核心焦点。AI推理主要分为预填充(pre-fill)和解码(decode)两个阶段,其中大型AI模型的解码过程尤其缓慢。针对这一技术瓶颈,英伟达选择通过外部技术整合来突破物理极限。据华尔街日报报道,英伟达去年底斥资200亿美元获得了初创公司Groq的关键技术许可,并在一场大规模的“核心聘用”交易中吸纳了包括创始人Jonathan Ross在内的高管团队。

Groq所设计的“语言处理单元”(LPU)采用了与传统GPU截然不同的架构,在处理推理功能时表现出极高的效率。业内分析认为,即将发布的新品可能涉及具备颠覆性的下一代Feynman架构。据华尔街见闻此前文章,Feynman架构可能采用更广泛的SRAM集成方案,甚至通过3D堆叠技术将LPU深度整合其中,专门针对延迟和内存带宽这两大推理瓶颈进行优化,从而大幅降低AI智能体运行的能耗与成本。

产业或将再次增长

高宏表示,根据广发香港研究报告,搭载LPU芯片的机架旨在增强英伟达在推理领域的能力,预计LPU将配备给予SRAM的片上存储器,提供快速令牌生成和超低延迟功能,从而提升英伟达在推理领域的地位。

机架设计计划配备64个Groq的LPU,采用RealScale芯片到芯片互连技术。广发香港在报告中预计增强的LPU机架将搭载256个LPU,这些LPU将分布在多个基于52层M9Q布的PCB上。

此外,预计GTC大会将再次展示NVL576机架设计(包括中间层板MidPlane、正交背板),CPO/NPO等光学互联方案。多种重大创新设计,将极大提升产业规模前景。

风险提示:AI建设不及预期、国产算力芯片进度不及预期。

(以上内容仅供参考,不作为投资决策依据。投资有风险,入市需谨慎。)

南京晨报/爱南京记者 许崇静