點擊右上角微信好友
朋友圈
請使用瀏覽器分享功能進行分享
智通財經(jīng)APP獲悉,國泰海通發(fā)布研報稱,英偉達下一代Rubin CPX在硬件層面上分拆了AI推理的計算負載,內(nèi)存升級提供更高速傳輸。隨著運算速度的提升,DRAM及NAND Flash在各類AI延伸應(yīng)用,如智能手機、服務(wù)器、筆電的單機平均搭載容量均有成長,又以服務(wù)器領(lǐng)域成長幅度最高,2024年Server DRAM單機平均容量年增17.3%。伴隨AI服務(wù)器需求持續(xù)增加,AI高端芯片如英偉達下一代Rubin及云端服務(wù)業(yè)者(CSP)自研ASIC陸續(xù)推出或開始量產(chǎn),有助于高速運算的DRAM產(chǎn)品量價齊升。建議關(guān)注存儲模組。
國泰海通主要觀點如下:
英偉達下一代Rubin CPX在硬件層面上分拆了AI推理的計算負載,內(nèi)存升級提供更高速傳輸。
下一代英偉達旗艦AI服務(wù)器NVIDIA Vera Rubin NVL144 CPX集成了36個Vera CPU、144塊Rubin GPU和144塊Rubin CPX GPU。同時,單個機架提供100 TB的高速內(nèi)存和1.7 PB/s的內(nèi)存帶寬。搭載Rubin CPX的Rubin機架在處理大上下文窗口時的性能,比當(dāng)前旗艦機架GB300 NVL72高最多6.5倍。
英偉達新品在硬件層面上分拆了AI推理的計算負載:上下文階段屬于計算受限,需要高吞吐量的處理能力來攝取并分析大量輸入數(shù)據(jù),從而生成首個輸出token;相反,生成階段則屬于內(nèi)存帶寬受限,依賴高速的內(nèi)存?zhèn)鬏敽透邘捇ヂ?lián),以維持逐個token的輸出性能。Rubin CPX專門針對“數(shù)百萬tokens”級別長上下文性能進行優(yōu)化,具備30peta FLOPs的NVFP4算力、128 GB GDDR7內(nèi)存。
開普云收購深圳金泰克存儲條線業(yè)務(wù),發(fā)力企業(yè)級DDR。
開普云發(fā)布公告,擬通過發(fā)行股份的方式,購買深圳金泰克持有的南寧泰克30%股權(quán),同時深圳金泰克將其存儲產(chǎn)品業(yè)務(wù)的經(jīng)營性資產(chǎn)轉(zhuǎn)移至南寧泰克。同時根據(jù)《股權(quán)收購框架協(xié)議》約定,公司擬收購南寧泰克70%股權(quán),交易對方深圳金泰克將其存儲產(chǎn)品業(yè)務(wù)的經(jīng)營性資產(chǎn)轉(zhuǎn)移至南寧泰克。
供應(yīng)商陸續(xù)推出AI高端芯片,內(nèi)存升級助力DRAM量價齊升。
隨著運算速度的提升,DRAM及NAND Flash在各類AI延伸應(yīng)用,如智能手機、服務(wù)器、筆電的單機平均搭載容量均有成長,又以服務(wù)器領(lǐng)域成長幅度最高,2024年Server DRAM單機平均容量年增17.3%。伴隨AI服務(wù)器需求持續(xù)增加,AI高端芯片如英偉達下一代Rubin及云端服務(wù)業(yè)者(CSP)自研ASIC陸續(xù)推出或開始量產(chǎn),有助于高速運算的DRAM產(chǎn)品量價齊升。
風(fēng)險提示:國產(chǎn)替代進程不及預(yù)期;技術(shù)迭代不及預(yù)期。