NVIDIA要用上X3D堆叠设计!下代Feynman GPU将引入LPU
快科技12月29日消息,虽然NVIDIA目前在AI训练领域无可匹敌,但面对日益增长的即时推理需求,其正筹划一项足以改变行业格局的“秘密武器”。
据AGF透露,NVIDIA计划在2028年推出的Feynman(费曼)架构GPU中,整合来自Groq公司的LPU(语言处理单元),以大幅提升AI推理性能。
Feynman架构将接替Rubin架构,采用台积电最先进的A16(1.6nm)制程,为了突破半导体物理限制,NVIDIA计划利用台积电的SoIC混合键合技术,将专为推理加速设计的LPU单元直接堆叠在GPU之上。

这种设计类似于AMD的3D V-Cache技术,但NVIDIA堆叠的不是普通缓存,而是专为推理加速设计的LPU单元。
设计的核心逻辑在于解决SRAM的微缩困境,在1.6nm这种极致工艺下,直接在主芯片集成大量SRAM成本极高且占用空间。
通过堆叠技术,NVIDIA可以将运算核心留在主芯片,而将需要大量面积的SRAM独立成另一层芯片堆叠上去。
台积电的A16制程一大特色是支持背面供电技术,这项技术可以腾出芯片正面的空间,专供垂直信号连接,确保堆叠的LPU能以极低功耗进行高速数据交换。
结合LPU的“确定性”执行逻辑,未来的NVIDIA GPU在处理即时AI响应(如语音对话、实时翻译)时,速度将实现质的飞跃。
不过这也存在两大潜在挑战,分别是散热问题和CUDA兼容性难题,在运算密度极高的GPU 再加盖一层芯片,如何避免“热当机”是工程团队的头号难题。
同时LPU强调“确定性”执行顺序,需要精确的内存配置,而CUDA生态则是基于硬件抽象化设计的,要让这两者完美协同,需要顶级的软件优化。

《NVIDIA要用上X3D堆叠设计!下代Feynman GPU将引入LPU》转载自互联网,如有侵权,联系我们删除,QQ:369-8522。
相关图文
-
小米18 Pro首发!高通骁龙8 Elite Gen6 Pro成本突破300美元
快科技1月19日消息,高通将和苹果、联发科一道,成为业内首批发布2nm制程芯片的企业。这次高通将会推出两款2nm芯片,分别是骁龙8 Elite Gen6和骁龙8 Elite Gen6 Pro。市场消息称台积电2nm制程... -
又一家手机品牌离开 华硕手机退场:未来不再推出新机
快科技1月19日消息,近日华硕举行了年末联欢晚会,华硕集团董事长施崇棠对华硕暂停手机业务做了公开回应。施崇棠表示,华硕Zenfone、ROG Phone双品牌从2026年起停止推出新机,我们一定会照顾好... -
REDMI Turbo 5 Max首发迄今最大小米金沙江电池:容量为9000mAh
快科技1月19日消息,REDMI宣布Turbo 5 Max升级9000mAh超大容量电池,这也是迄今最大小米金沙江电池,重度使用也能妥妥用一天。据悉,这块电池拥有894Wh/L小米史上最大能量密度,含硅量达到16%... -
红魔11 Air宣布搭载行业独家游戏肩键!操作零门槛 秒变大神
快科技1月19日消息,今日,红魔游戏手机宣布,红魔11 Air搭载行业独家红魔游戏肩键,拥有520Hz行业最快触发、超大感应面积、防手汗设计。红魔游戏肩键号称操作零门槛,轻松进阶大神,支持... -
REDMI Turbo 5 Max外观首次亮相:优雅大R角+金属中框 最具旗舰质感性能机
快科技1月19日消息,与以往REDMI新机直接官宣发布时间不同,REDMI Turbo 5 Max选择先行预热,暂未公布发布会时间。今日,REDMI手机正式公布REDMI Turbo 5 Max海风蓝配色外观,官方称其为REDMI...











