【文/觀察者網(wǎng)專欄作者 心智觀察所】
當(dāng)徐直軍站在2025年華為全聯(lián)接大會的舞臺上,宣布Atlas 950超節(jié)點(diǎn)支持8192張昇騰卡、總算力達(dá)到8E FLOPS時,臺下響起的掌聲或許意味著中國AI產(chǎn)業(yè)一個重要拐點(diǎn)的到來。這不僅僅是一次產(chǎn)品發(fā)布,更像是華為在經(jīng)歷DeepSeek沖擊后的一次戰(zhàn)略反擊——用技術(shù)創(chuàng)新回應(yīng)質(zhì)疑,用開放生態(tài)對抗封鎖。
在全球AI算力競賽日趨白熱化的當(dāng)下,華為選擇了一條與眾不同的道路:不再單純追趕英偉達(dá)的單卡性能,而是通過革命性的“超節(jié)點(diǎn)”架構(gòu),試圖在萬卡級互聯(lián)技術(shù)上實現(xiàn)彎道超車。這背后折射的,是中美科技博弈進(jìn)入新階段的深層邏輯——當(dāng)先進(jìn)制程工藝受限時,如何通過系統(tǒng)性創(chuàng)新突破算力瓶頸,成為決定未來AI話語權(quán)的關(guān)鍵變量。
技術(shù)突破的三重維度:從芯片到架構(gòu)的全棧創(chuàng)新
華為此次發(fā)布的昇騰950系列芯片,最引人注目的技術(shù)亮點(diǎn)在于對多種低精度數(shù)據(jù)格式的全面支持。相比前代產(chǎn)品,950系列不僅支持業(yè)界標(biāo)準(zhǔn)的FP8、MXFP8、MXFP4格式,更重要的是推出了自研的HiF8格式——在保持FP8高效性的同時,精度無限接近FP16。
這一技術(shù)路線的選擇并非偶然。在先進(jìn)制程工藝受限的背景下,通過降低數(shù)值精度來提升算力密度,成為華為繞過制程限制的重要策略。HiF8格式的推出,實際上是華為在算法優(yōu)化與硬件設(shè)計之間找到的一個巧妙平衡點(diǎn):既能顯著提升推理吞吐,又能保證模型精度不受明顯影響。
更值得關(guān)注的是,華為首次在昇騰芯片中引入了SIMD/SIMT新同構(gòu)設(shè)計。這種創(chuàng)新架構(gòu)允許同一個計算單元既能像流水線一樣處理“大塊”向量數(shù)據(jù),又能靈活處理“碎片化”數(shù)據(jù)。這種設(shè)計哲學(xué)的轉(zhuǎn)變,反映了華為對AI計算模式演進(jìn)趨勢的深刻理解——隨著模型復(fù)雜度不斷提升,對靈活性和效率的要求將同等重要。
在內(nèi)存技術(shù)方面,華為同樣展現(xiàn)出了令人印象深刻的系統(tǒng)性思維。針對不同應(yīng)用場景的特殊需求,華為自研了兩種HBM技術(shù):面向推理Prefill階段的低成本HiBL 1.0,以及面向訓(xùn)練和Decode階段的高性能HiZQ 2.0。
這種“一芯兩用”的設(shè)計理念,實際上是對傳統(tǒng)“一刀切”芯片設(shè)計模式的顛覆。通過將同一個die與不同規(guī)格的自研HBM合封,華為實現(xiàn)了在成本和性能之間的精確平衡。這不僅能夠降低客戶的整體擁有成本,更重要的是體現(xiàn)了華為在供應(yīng)鏈自主可控方面的戰(zhàn)略考量。
如果說前兩個層面的創(chuàng)新更多體現(xiàn)在硬件優(yōu)化上,那么“靈衢”(UnifiedBus)協(xié)議的推出,則代表了華為在系統(tǒng)架構(gòu)層面的根本性突破。
傳統(tǒng)的GPU集群方案面臨著兩個根本性挑戰(zhàn):長距離高可靠互聯(lián),以及大帶寬低時延傳輸。華為通過在互聯(lián)協(xié)議的每一層都引入高可靠機(jī)制,在光路引入百納秒級故障檢測,重新定義光器件和互聯(lián)芯片,實現(xiàn)了光互聯(lián)可靠性提升100倍,互聯(lián)距離超過200米。
更令人驚嘆的是,華為聲稱Atlas 950超節(jié)點(diǎn)的互聯(lián)帶寬達(dá)到16PB/s——這個數(shù)字超過了當(dāng)前全球互聯(lián)網(wǎng)峰值帶寬的10倍。這意味著華為不僅在技術(shù)指標(biāo)上實現(xiàn)了突破,更在工程實現(xiàn)上達(dá)到了前所未有的復(fù)雜度。
戰(zhàn)略選擇的深層邏輯:為什么是超節(jié)點(diǎn)?
華為選擇超節(jié)點(diǎn)技術(shù)路線,根本原因在于對自身技術(shù)約束的清醒認(rèn)識。
徐直軍在發(fā)言中明確提到:“中國半導(dǎo)體制造工藝將在相當(dāng)長時間處于落后狀態(tài)?!痹谶@種約束下,單純追求單芯片性能的提升空間有限,而通過系統(tǒng)級創(chuàng)新實現(xiàn)整體算力突破,成為更為現(xiàn)實的選擇。
超節(jié)點(diǎn)架構(gòu)的核心價值在于,它能夠?qū)?shù)千乃至上萬顆芯片整合為一個邏輯上的“超級計算機(jī)”。這種架構(gòu)創(chuàng)新不僅能夠充分發(fā)揮每顆芯片的計算潛力,更重要的是通過優(yōu)化的互聯(lián)協(xié)議,最大程度地降低了通信開銷和延遲。
隨著大模型參數(shù)規(guī)模不斷攀升,從千億級向萬億級發(fā)展,傳統(tǒng)的單卡或小規(guī)模集群方案越來越難以滿足訓(xùn)練需求。華為推出的Atlas 950超節(jié)點(diǎn)支持8192卡,Atlas 960超節(jié)點(diǎn)支持15488卡,直接瞄準(zhǔn)了未來大模型訓(xùn)練的核心需求。
特別是在推理場景中,隨著Agent技術(shù)的快速發(fā)展,輸入上下文長度呈指數(shù)級增長,Prefill階段的計算需求急劇上升。華為針對這一趨勢,專門設(shè)計了Ascend 950PR芯片,配合低成本HiBL 1.0內(nèi)存,實現(xiàn)了成本和性能的最優(yōu)平衡。
華為宣布開放靈衢2.0技術(shù)規(guī)范,這一決策背后蘊(yùn)含著深刻的生態(tài)建設(shè)考量。在英偉達(dá)CUDA生態(tài)占據(jù)絕對主導(dǎo)地位的情況下,華為選擇開放核心技術(shù),實際上是在構(gòu)建一個以自己為中心的新生態(tài)圈。
這種開放策略的風(fēng)險和收益并存。一方面,開放技術(shù)規(guī)范能夠吸引更多合作伙伴參與,加速技術(shù)迭代和應(yīng)用落地;另一方面,也存在核心技術(shù)外流的風(fēng)險。但在當(dāng)前的市場環(huán)境下,封閉的生態(tài)很難與英偉達(dá)正面競爭,開放或許是華為的最優(yōu)選擇。
技術(shù)挑戰(zhàn):單芯片性能差距與工程復(fù)雜性
首先必須正視的是,在單芯片層面,華為昇騰芯片與英偉達(dá)產(chǎn)品仍存在顯著差距。受制于先進(jìn)制程工藝的獲取限制,華為昇騰910C芯片采用的7nm工藝,相比英偉達(dá)H100/H200的4nm工藝存在明顯代差。這種制程差距直接導(dǎo)致在相同功耗下,單芯片算力密度、能效比等關(guān)鍵指標(biāo)的劣勢。
根據(jù)公開數(shù)據(jù),英偉達(dá)H100的FP16算力約為1000 TFLOPS,而華為昇騰910C約為640 TFLOPS,差距達(dá)到40%以上。在更關(guān)鍵的AI訓(xùn)練場景中,這種性能差距可能進(jìn)一步放大。華為試圖通過多芯片互聯(lián)的系統(tǒng)性優(yōu)勢來彌補(bǔ)單芯片性能不足,但這種策略的有效性仍需市場驗證。
萬卡級超節(jié)點(diǎn)的技術(shù)實現(xiàn)難度更是遠(yuǎn)超想象。
以Atlas 950超節(jié)點(diǎn)為例,8192張卡意味著需要處理海量的卡間通信,任何一個環(huán)節(jié)的故障都可能導(dǎo)致整個系統(tǒng)的崩潰。華為力圖通過靈衢協(xié)議實現(xiàn)了“萬卡超節(jié)點(diǎn),一臺計算機(jī)”,但這一技術(shù)承諾的實際驗證,需要在真實的大規(guī)模部署中才能得到答案。
特別是在軟件適配方面,如何讓現(xiàn)有的AI框架和應(yīng)用程序能夠充分發(fā)揮萬卡超節(jié)點(diǎn)的性能優(yōu)勢,需要大量的優(yōu)化工作。這不僅需要華為自身的技術(shù)投入,更需要整個軟件生態(tài)的配合。
除此之外,客戶認(rèn)知與接受度也是個問題。雖然華為在技術(shù)指標(biāo)上聲稱全面超越英偉達(dá)產(chǎn)品,但市場接受度的建立需要時間。目前AI行業(yè)的主流開發(fā)框架和工具鏈都是圍繞英偉達(dá)GPU優(yōu)化的,遷移到昇騰平臺需要額外的開發(fā)成本和學(xué)習(xí)成本。
更重要的是,大型AI公司在選擇算力平臺時,不僅考慮性能指標(biāo),還要考慮供應(yīng)鏈穩(wěn)定性、技術(shù)支持質(zhì)量、生態(tài)完整性等多個因素。華為需要在這些軟實力方面證明自己。
雖然華為在芯片設(shè)計、系統(tǒng)架構(gòu)等方面實現(xiàn)了突破,但在光器件、高端封裝、精密制造等環(huán)節(jié),仍然面臨供應(yīng)鏈約束。特別是在先進(jìn)制程芯片制造方面,華為仍然依賴于有限的代工廠資源。
這種依賴性不僅影響產(chǎn)能釋放,更可能在地緣政治風(fēng)險升級時,成為華為AI戰(zhàn)略的致命弱點(diǎn)。
地緣政治博弈中的互聯(lián)技術(shù)爭奪戰(zhàn)
值得關(guān)注的是,華為在互聯(lián)技術(shù)上的突破,與英偉達(dá)2020年收購Mellanox的戰(zhàn)略布局形成了有趣的對比和競爭。英偉達(dá)以70億美元收購這家以色列高速互聯(lián)技術(shù)公司,正是看中了其在InfiniBand和以太網(wǎng)互聯(lián)技術(shù)方面的領(lǐng)先地位。這筆交易使英偉達(dá)在數(shù)據(jù)中心互聯(lián)領(lǐng)域獲得了關(guān)鍵技術(shù)優(yōu)勢,為其GPU集群方案提供了完整的技術(shù)閉環(huán)。
然而,這筆收購在中國遭遇了長時間的反壟斷審查,最終在附加條件下才獲得批準(zhǔn)。中國監(jiān)管部門的擔(dān)憂并非沒有道理——控制了高端互聯(lián)技術(shù)的英偉達(dá),幾乎可以主導(dǎo)整個AI基礎(chǔ)設(shè)施的技術(shù)標(biāo)準(zhǔn)和供應(yīng)鏈。這種擔(dān)憂在今天看來更具前瞻性:當(dāng)英偉達(dá)通過CUDA生態(tài)和Mellanox互聯(lián)技術(shù)構(gòu)建起完整的技術(shù)壁壘時,其他廠商想要突破變得極其困難。
從這個角度看,華為推出靈衢協(xié)議并選擇開源開放,實際上是在重新定義互聯(lián)技術(shù)的游戲規(guī)則。華為的策略是:既然無法在英偉達(dá)構(gòu)建的技術(shù)體系內(nèi)競爭,那就創(chuàng)建一個全新的技術(shù)標(biāo)準(zhǔn)和生態(tài)系統(tǒng)。靈衢協(xié)議不僅是技術(shù)突破,更是對“英偉達(dá)-Mellanox”技術(shù)聯(lián)盟的直接挑戰(zhàn)。
近期中國大陸下令阿里、字節(jié)跳動等科技巨頭禁購英偉達(dá)RTX Pro 6000D等高端GPU,這一政策信號具有重要的象征意義。它不僅體現(xiàn)了監(jiān)管層對關(guān)鍵技術(shù)自主可控的重視,更為華為等本土廠商創(chuàng)造了市場機(jī)遇窗口。
這種政策導(dǎo)向的變化,實際上是中美科技博弈進(jìn)入新階段的重要標(biāo)志。過去更多是美國對中國的技術(shù)封鎖,現(xiàn)在中國也開始主動采取措施,減少對美國關(guān)鍵技術(shù)的依賴。
面對華為的趕超,英偉達(dá)應(yīng)時而動,也在調(diào)整自己的戰(zhàn)略布局。就在華為華為全聯(lián)接大會召開之時,業(yè)界傳出了英偉達(dá)入股英特爾的消息,反映了技術(shù)巨頭們在不確定環(huán)境下尋求新合作模式的趨勢。
對英偉達(dá)而言,中國市場的重要性不言而喻。面對華為等競爭對手的強(qiáng)力沖擊,英偉達(dá)需要在技術(shù)領(lǐng)先性和地緣政治風(fēng)險之間找到新的平衡點(diǎn)。
前景展望:技術(shù)創(chuàng)新與市場競爭的雙重考驗
華為的超節(jié)點(diǎn)戰(zhàn)略,代表了中國AI產(chǎn)業(yè)在面臨外部壓力時的一次重要技術(shù)轉(zhuǎn)向。從單純的追趕模式,轉(zhuǎn)向差異化創(chuàng)新模式,這種戰(zhàn)略調(diào)整本身就具有重要意義。
短期內(nèi),華為需要證明其萬卡級超節(jié)點(diǎn)的技術(shù)可行性和商業(yè)價值。Atlas 950超節(jié)點(diǎn)計劃于2026年四季度上市,這將是檢驗華為技術(shù)承諾的關(guān)鍵時點(diǎn)。如果華為能夠如期交付并達(dá)到承諾的性能指標(biāo),將極大地提振中國AI產(chǎn)業(yè)的信心。長期來看,超節(jié)點(diǎn)技術(shù)路線是否能夠真正撼動英偉達(dá)的市場地位,還取決于多個因素的綜合作用:技術(shù)迭代速度、生態(tài)建設(shè)進(jìn)度、政策環(huán)境變化,以及客戶接受度等。
但無論如何,華為這次的技術(shù)突破已經(jīng)表明,在AI算力這個關(guān)鍵賽道上,中美之間的技術(shù)差距正在縮小。這不僅是中國科技實力提升的重要體現(xiàn),更可能預(yù)示著全球AI產(chǎn)業(yè)格局的深刻變革。
在這場沒有硝煙的算力戰(zhàn)爭中,華為已經(jīng)打響了反擊的第一槍。接下來的較量,將決定未來AI時代的話語權(quán)歸屬。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個人觀點(diǎn),不代表平臺觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。