英伟达美国当地时日,发布了面向大规模上下文推理处理和视频生成AI应用的Rubin CPX GPU。该GPU基于“Rubin”架构构建但与此前已公布的RubinTensorCoreGPU又有不少区别之处。
Rubin CPX GPU采用经济高效的单片式设计,注重NVFP4数据格式计算资源,同时搭载了NVENC/NVDNC视频编解码单元,配GB的GDDR7显存。
根据英伟达官方提供的Rubin CPX GPU渲染图,该GPU包×4×3×4=192组的重复单元(参见下图黄色方框),应该对应组SM,这一数量与GB202相当。
而在机架系统层面,从 Vera Rubin NVL144到Vera Rubin NVL144 CPX,系统增加块Rubin CPX GPU,NVFP4算力提升𱅀.4EFLOPS、显存带宽提升𱄼.3PB/s、快速存储增长TB。
从显存带宽角度,每颗Rubin CPX GPU大致对应GB/s显存带宽。考虑-bit显存位宽的GeForce RTX 5090拥GB/s的显存带宽、Rubin CPX GPU的显存容量GB,Rubin CPX GPU应同样具-bit的显存位宽,显存等效速率估算数值约.55Gbps。
關(guān)于我們|版權(quán)聲明| 違法和不良信息舉報(bào)電話:010-84151598 | 網(wǎng)絡(luò)敲詐和有償刪帖舉報(bào)電話:010-84151598
Copyright ? 2008-2024 by {當(dāng)前域名}. all rights reserved