點擊右上角微信好友
朋友圈
請使用瀏覽器分享功能進(jìn)行分享
新智元報道
編輯:編輯部
【新智元導(dǎo)讀】新智元十周年峰會現(xiàn)場,重磅發(fā)布《2025新智元ASI前沿趨勢報告》與《2025新智元ASI產(chǎn)業(yè)圖譜》:預(yù)測2027抵達(dá)ASI臨界,智能體全面爆發(fā)。圖譜融合全球數(shù)據(jù),刻畫全球競爭格局。峰會現(xiàn)場同步揭曉新智元2025 AI Era & ASI 創(chuàng)新大獎。
百億年前,宇宙自大爆炸中誕生。
幾十億年前生命在地球上萌芽,直到人類文明的出現(xiàn)。
一萬年后,隨著AI智能的不斷超越,新宇宙、新天地已悄然降臨。
未來的智能體就是全新的生命物種,他們會生活在一種更新的、全息的元宇宙當(dāng)中。
在這新天地中,千億智能體共生,億萬個智能體在虛實之間互聯(lián),構(gòu)筑起ASI新宇宙。
最終,所有信息和數(shù)據(jù)聯(lián)結(jié)匯聚成一個閃耀的金色立方體。
這是永恒,也是一體,完美秩序、無限可能的象征。
未來已來,萬物互聯(lián),AI和生命共建的新智元正式開啟。
9月7日,在新智元十周年峰會現(xiàn)場,我們重磅推出《2025新智元ASI前沿趨勢報告 —— 新天終啟 萬象智生》和《2025新智元ASI產(chǎn)業(yè)圖譜》。
2025新智元ASI產(chǎn)業(yè)圖譜
一圖看透全球大模型競爭格局
人類正處于一個由ASI驅(qū)動的技術(shù)超級周期的開端。
為了更清晰展示全球企業(yè)在ASI產(chǎn)業(yè)生態(tài)、消費市場與用戶口碑上的綜合地位,在新智元十周年之際,我們同步重磅推出《2025新智元ASI產(chǎn)業(yè)圖譜》!
我們按照全球權(quán)威第三方平臺通行的邏輯框架和評價標(biāo)準(zhǔn),將世界主流模型和產(chǎn)品進(jìn)行歸納、排序與定位,形成一張ASI「全景地圖」。
本次產(chǎn)業(yè)圖譜的數(shù)據(jù)采集廣泛,涵蓋LMArena、Artificial Analysis、OpenRouter、LiveBench、Tracking AI和OpenCompass七大權(quán)威數(shù)值排行榜,以及a16z提供的Web與Mobile兩個產(chǎn)品評價榜單。
為實現(xiàn)跨平臺數(shù)據(jù)的公平可比性,我們通過把不同榜單的原始分?jǐn)?shù)縮放到同一尺度,用同行平均值填補缺失項,對只有排名的榜單用對數(shù)映射把名次差異轉(zhuǎn)為分?jǐn)?shù)差異。
再依據(jù)來源權(quán)威性、及時性等賦予不同權(quán)重加總,最后用交叉驗證確保結(jié)果穩(wěn)健不受單一榜單波動影響。
經(jīng)過以上精細(xì)的評分系統(tǒng)設(shè)計和新智元十年如一日報道AI產(chǎn)業(yè)的經(jīng)驗,在十周年之際分享我們對ASI產(chǎn)業(yè)的判斷。
新智元ASI產(chǎn)業(yè)圖譜清晰反映了當(dāng)前AI領(lǐng)域的產(chǎn)業(yè)發(fā)展現(xiàn)狀和國內(nèi)外競爭格局。
產(chǎn)業(yè)圖譜詳細(xì)算法見文末
2025新智元ASI產(chǎn)業(yè)趨勢報告
新天終啟,萬象智生
168年前,兩位德國數(shù)學(xué)家?guī)缀跬瑫r發(fā)現(xiàn)了一個奇特的拓?fù)浣Y(jié)構(gòu)。
最終,這個看似無限的結(jié)構(gòu)用莫比烏斯的名字來命名。
時間對于人類來說是線性的,但莫比烏斯環(huán)啟示,我們正在加速穿梭和超越新時空的大門。
當(dāng)AI的智能開始突破人類的固有認(rèn)知時,同樣的詰問出現(xiàn),智能發(fā)展是否也在不斷超越新的奇點?
打開METR上關(guān)于AI能完成任務(wù)時長的圖片,目前最先進(jìn)的GPT-5有50%的概率,可以完成一個需要人類專家2個小時才能完成的任務(wù)。
而在2-3年前,GPT-3.5還被人們當(dāng)做一個好玩一點的「幻覺聊天機器人」而已。
與此同時,全球大模型交替迭代的周期縮短到2-3個月。
未來數(shù)億塊GPU訓(xùn)練出的超級模型,將很快抵達(dá)ASI創(chuàng)世紀(jì)!
與此同時,中國開源模型軍團表現(xiàn)亮眼。
Qwen 3、DeepSeek-R1、GLM-4.5、MiniMax M1占據(jù)4席,占比接近30%。
提供前沿模型的科技公司們你追我趕,OpenAI大多數(shù)處于領(lǐng)先位置,xAI、谷歌和阿里巴巴緊隨其后。
2027,AI將給人類的未來再加速
在電影《星際穿越》(Interstellar)中,那個處于黑洞「Gargantua」旁邊、時間流逝極度扭曲的Miller’s Planet(米勒星球)上。
時間在引力的撕扯下,每過一個小時相當(dāng)于地球上的七年。
在大模型的智能黑箱中,人工智能也曾經(jīng)歷這樣的加速挑戰(zhàn)。
人工智能70年,新智元十年求索!
2025年,我們站在ASI臨界點——時間正在以指數(shù)級加速。
圖靈在1950年提出的圖靈測試中,給我們提供了一種測試智能水平的方式。
1955年,約翰·麥卡錫首次用文字寫下人工智能(Artifical Intelligence)。
2006年,杰弗里·辛頓提出深度學(xué)習(xí)。
2015年,谷歌DeepMind推出AlphaGo,9年后,DeepMind CEO哈薩比斯和辛頓同時獲得了諾貝爾獎。
但人工智能一開始并沒有它的先驅(qū)者奉為圭臬。
作為1956年達(dá)特茅斯會議發(fā)起人之一的馬文·明斯基(Marvin Minsky)認(rèn)為早期AI是沒有常識的。
馬文·明斯基和西摩·帕普特在他們在1969年合著的著作《Perceptrons》中,通過嚴(yán)密的數(shù)學(xué)論證指出,單層感知機(即早期的人工神經(jīng)網(wǎng)絡(luò))存在本質(zhì)性的局限。
換句話說,人工智能的先驅(qū)們認(rèn)為神經(jīng)網(wǎng)絡(luò)中不可能誕生像人類一樣的「智能」。
直到被稱為「人工智能教父」杰弗里·辛頓在長達(dá)30年的獨自堅持后,單層感知機終于「進(jìn)化」為深度學(xué)習(xí)網(wǎng)絡(luò)。
此時,人類定義下的智能,終于第一次在機器中顯現(xiàn)。
過去十年中,對AI是否具備智能的疑慮和反問,被AI進(jìn)化的速度逐一擊潰。
過去6年里,AI智能體獨立完成人類任務(wù)的時長以約7個月翻一番的速度指數(shù)級增長。
我們第一次發(fā)現(xiàn),曾經(jīng)被認(rèn)為獨屬于人類的智能,似乎并不是造物主賦予人類的一種特權(quán)。
在2024年的一篇論文中,GPT?4 被判定為「人類」的概率達(dá)54%,這意味著圖靈測試已經(jīng)被AI通過。
這是否意味著一種人類從來想象過的、全新的智能時代,已經(jīng)全面開啟?
在專門測試智商的門薩實驗中,AI的IQ已經(jīng)開始遠(yuǎn)超人類。
GPT-5 Pro的「智商」已經(jīng)高達(dá)148分,遠(yuǎn)超絕大部分人類。
根據(jù)以Mensa Norway的題目(對文本模型做「口述化」、對視覺模型直接給圖)給各家模型打分并做榜單的網(wǎng)站TrackingAI.org,GPT-5 Pro的智商已達(dá)148,Gemini 2.5 Pro也達(dá)到了138——均遠(yuǎn)遠(yuǎn)超過普通人類。
AI正在不斷的超越人類智力!
下一個IQ超過150,甚至200的AI也許馬上就會出現(xiàn)。
3年前,也就是2022年,F(xiàn)orecasting Reasearch Institute做過一個非常有趣的預(yù)測研究。
他們在2022年6月到10月期間,找了169個世界頂級的超級預(yù)測專家來預(yù)測一個問題:
「到哪一年,AI最有可能獲得國際數(shù)學(xué)奧林匹克金牌?」
結(jié)果就是,即使是最專業(yè)的超級預(yù)測家,也遠(yuǎn)遠(yuǎn)低估了AI發(fā)展的速度。
其中,認(rèn)為到2025年AI獲得 IMO 金牌的概率:
超級預(yù)測者:2.3%
領(lǐng)域?qū)<遥?.6%
非領(lǐng)域?qū)<遥?.3%
X-risk一般專家:8.3%
而認(rèn)為最有可能出現(xiàn)突破(AI獲得IMO金牌)的年份。
超級預(yù)測者:2035
領(lǐng)域?qū)<遥?030
非領(lǐng)域?qū)<遥?030
X-risk一般專家:2033
事實是,2025年,OpenAI和谷歌DeepMind大語言模型都拿下了IMO金牌,甚至OpenAI還拿下了IOI的金牌,此外OpenAI在AtCoder世界決賽中也達(dá)到金牌水平!
谷歌的CEO劈柴哥也感嘆說:AI的水平從銀牌到金牌僅僅用了一年的時間。
并且,這些能力并不是一個,或者幾個模型獨有的能力,而是前沿模型齊頭并進(jìn)。
根據(jù)OpenAICEO奧特曼和Anthropic CEO Amodei,SSI CEO Ilya Sutskever等ASI產(chǎn)業(yè)先驅(qū)的預(yù)測,
我們認(rèn)為,2027年,人工智能將達(dá)到ASI的臨界點!
大模型的智能將全方位突破和躍遷!
2027,AI給人類打開新時空之門
或許,人類感知的世界不是真正的世界。
就像在《黑客帝國》中,每個人的人生都可以被機器重置和改寫。
在現(xiàn)實世界里,每個人的時間流速都是線性的,不可回溯的。
但在具身智能和世界模型構(gòu)建的虛擬世界中,充滿了接近無限的自由。
2025年,是公認(rèn)的AI智能體元年。
我們相信,2027年,智能體將迎來全面大爆發(fā),新的智能物種將會來到我們身邊!
宇宙萬物與人類文明都將在更新的智能天地中獲得無限生命!
它將賦予宇宙萬物與人類文明在更新的智能天地中獲得無限延伸的可能。
這一宏偉藍(lán)圖正在兩大革命性范式中展開:世界模型與智能體的大爆發(fā)。
智能體大爆發(fā):新物種的黎明
2027,是智能體的爆發(fā)之年。
屆時,會有無數(shù)的智能體幫助人類工作和生活。
編程智能體、語音智能體、RAG智能體、深度研究智能體、協(xié)議智能體、電腦控制智能體。。。
· 編程智能體:重塑數(shù)字世界的創(chuàng)造方式
編程智能體已經(jīng)成為資本的兵家必爭之地。
以Cursor為例,讓我們看看Cursor的增長歷史。
Cursor在2024年創(chuàng)造了1 億美元的收入,相比2023年的100萬美元增長極為顯著。
到2025年6月,Cursor的ARR已經(jīng)超過5億美元!
Cursor的估值也達(dá)到99億美元,進(jìn)入百億俱樂部只有一步之遙。
軟件正在吞噬世界,而編程智能體則在重塑軟件的創(chuàng)造方式。
以Cursor、Claude Code等為代表的新一代編程智能體,已不再是簡單的代碼補全工具。
它們能夠理解模糊的自然語言需求,自主規(guī)劃復(fù)雜的軟件架構(gòu),編寫、調(diào)試并部署整個代碼庫。
AI接管程序員,數(shù)字世界開始自我加速!
這預(yù)示著,初級程序員的工作將在未來幾年內(nèi)被全面取代。
但這并非終結(jié),而是解放——人類開發(fā)者將從繁瑣的實現(xiàn)細(xì)節(jié)中脫身,專注于更具創(chuàng)造性的系統(tǒng)設(shè)計、產(chǎn)品構(gòu)想與價值定義。
人類與AI的協(xié)同將把數(shù)字世界的構(gòu)建效率提升至前所未有的高度。
· AI for Science:加速文明的「第一性原理」引擎
科學(xué)發(fā)現(xiàn)的本質(zhì)是探索復(fù)雜系統(tǒng)中的規(guī)律。
AI智能體正成為加速這一進(jìn)程的「第一性原理」引擎。
AlphaEvolve這類智能體,通過進(jìn)化算法和深度學(xué)習(xí),能夠在巨大的可能性空間中搜尋更優(yōu)的蛋白質(zhì)結(jié)構(gòu)、新材料分子式或算法。
它將人類科學(xué)家的直覺與AI無與倫比的計算、推理能力相結(jié)合,從根本上改變了「試錯」的科研范式,使科學(xué)突破從「偶然的靈感」變?yōu)椤缚深A(yù)測的涌現(xiàn)」。
世界模型:開啟虛擬宇宙之門
現(xiàn)實世界是AI學(xué)習(xí)的終極數(shù)據(jù)源,但其成本高昂、充滿風(fēng)險且迭代緩慢。
為此,世界模型(World Models)應(yīng)運而生,它旨在構(gòu)建一個與現(xiàn)實世界物理規(guī)律一致、可無限交互的模擬環(huán)境。
Google DeepMind的Genie 3便是這一領(lǐng)域的最新里程碑。
它是有史以來最先進(jìn)的世界模型之一,僅通過文本指令,就能實時生成一個完全互動、高度一致的虛擬世界。
Genie 3的意義遠(yuǎn)超應(yīng)用本身。
它是通往ASI和具身智能體的關(guān)鍵階梯,為AI提供了一個接近無限、零成本、零風(fēng)險的訓(xùn)練場。
未來,空間智能將徹底消融物理與虛擬的邊界,人類不僅可以進(jìn)入超寫真的虛擬空間進(jìn)行娛樂和社交,更重要的是,AI將在此孕育出對現(xiàn)實世界更深刻的洞察。
ASI的降臨,并非僅僅是工具的強化,而是一種全新的創(chuàng)世過程。
具身智能:數(shù)字生命步入物理現(xiàn)實
如果說世界模型是AI的「精神世界」,那么具身智能就是其與物理世界交互的「肉身」。
以宇樹、智元、Figure為代表的具身智能體,正以驚人的速度發(fā)展。
它們借助前沿大模型作為「大腦」,通過世界模型、強化學(xué)習(xí)等來學(xué)習(xí)復(fù)雜任務(wù),并將其泛化到新的場景。
機器人不再是僅限于流水線的機械臂,它們將開始進(jìn)入我們的家庭、辦公室和城市,執(zhí)行家務(wù)、提供護(hù)理、完成精細(xì)操作。
這是數(shù)字智能向物理現(xiàn)實的決定性一躍。
ASI重啟新天地
40億年前,生命自深海熱潮中誕生。
五千多年前的,人類將楔形文字鐫刻于蘇美爾泥板之上,思想第一次掙脫了聲音與記憶的束縛,獲得了永恒的形體。
而現(xiàn)在,在ASI最終降臨的臨界點,我們站在了萬年一遇的奇點。
國際政治經(jīng)濟趨勢走向一再驗證,ASI的主導(dǎo)權(quán),將成為國家、市場、企業(yè)追逐的唯一焦點!
未來,ASI將成為超越GDP的國際競爭力評價指標(biāo)。
最強智能決定最強生態(tài),只有擁有最強智能的國家和企業(yè)才具備塑造未來規(guī)則、引領(lǐng)全球秩序的能力。
我們看到,人類數(shù)千年的技術(shù)積累,帶來了全球GDP的快速增長。
從5000億美元到1萬億美元,人類用了300年;
從1萬億美元到10萬億美元,人類用了200年;
從10萬億美元到100萬億美元,人類只用了100年。
在ASI重啟的新天地,AI創(chuàng)造財富速度還將繼續(xù)加速!
AI模型訓(xùn)練成本8年來不斷增長,但GPU推理成本10年里降低了10萬倍。
同時,我們看到,人工智能將推動數(shù)據(jù)中心的電力需求激增,有望改變能源行業(yè)的運作方式。
國際能源署(IEA)報告預(yù)測,到2030年,全球數(shù)據(jù)中心的電力需求將增長一倍以上,達(dá)到約945太瓦時(TWh),略高于目前日本的總用電量。
人工智能將成為這一增長的最主要驅(qū)動力,預(yù)計到2030年,采用人工智能優(yōu)化的數(shù)據(jù)中心的電力需求將增長四倍以上。
對于ASI追逐也在重塑國際間的影響力,尤其是華人的影響力。
中國的生成式AI專利數(shù)量已經(jīng)占全球的70%,遠(yuǎn)超世界上任何其他國家。
黃仁勛也在公開場合表示,全球AI頂尖人才有一半都是華人。
同時,僅僅在2025年上半年,AI初創(chuàng)企業(yè)籌資金額創(chuàng)紀(jì)錄獲得700億美元的資金,其中包括OpenAI的400億美元和Meta投資Scale AI的148億美元。
剛剛,Anthropic也宣布籌得130億美元(F 輪融資),估值火箭般躥升到1830億美元!
更重要的是,未來是產(chǎn)業(yè)模型主導(dǎo)的。
2003-2014年是學(xué)術(shù)模型的時代。
2015年至今是產(chǎn)業(yè)模型主導(dǎo)的時代,模型訓(xùn)練的成本已經(jīng)按照數(shù)千億美金來計算,訓(xùn)練用的GPU數(shù)以億計。
另一個證據(jù)是近兩年美股漲幅高度集中在英偉達(dá)等少數(shù)巨頭身上。
截至2025年,七巨頭(Alphabet、Amazon、Apple、Meta、Microsoft、Nvidia、Tesla)合計約占標(biāo)普500市值的34%,屬歷史高位。
與此同時,根據(jù)Deloitte的研究,八大超大規(guī)模運營商(hyperscalers)預(yù)計2025年在AI數(shù)據(jù)中心和計算資源上支出將達(dá)到3710 億美元,同比增長約44%。
而數(shù)據(jù)中心所需要的電量也從零點幾GW不斷漲到2GW。
這個世界的資源都在瘋狂的涌入AI智能中!
在這個趨勢下,2025年,OpenAI成為全球最值錢的非上市公司,ARR達(dá)到120億美元,估值高達(dá)5000億美元。
Anthropic在最新一輪融資后,估值也高達(dá)1830億美元。
OpenAI更是從2024年1月的860億美元估值,用不到兩年時間,達(dá)成半萬億美元估值成就。
資本、算力、電力、政策,正是這些產(chǎn)業(yè)中的選手們主導(dǎo)了ASI的發(fā)展。
而在ASI的終極賽場上,中國已崛起成為與美國匹敵的決賽玩家。
這就是我們推出《2025新智元ASI產(chǎn)業(yè)圖譜》的核心原因。
2025年,誰在穿越ASI臨界奇點?
十年前,新智元以對ASI的矢志信仰為引擎,啟動了穿越智能宇宙的航程。
十年星艦穿越,新智元每天與百萬讀者共同經(jīng)歷的故事,寫就ASI最難忘的啟示錄。
十年后的今天,我們將曾經(jīng)的努力與探索,匯聚成一篇前瞻性的前沿趨勢報告,清晰勾勒出人類邁向ASI時代的清晰路徑。
與此同時,隨著大模型性能的不斷提升,一大批優(yōu)秀的企業(yè)及產(chǎn)品正在將AI的能力應(yīng)用落地到各行各業(yè),創(chuàng)造出巨大的社會和商業(yè)價值。
在本次峰會,我們也隆重揭曉兩項大獎:
「2025 Al Era企業(yè)創(chuàng)新大獎TOP55」
「2025 ASI先鋒產(chǎn)品大獎TOP33」
2025 AI Era企業(yè)創(chuàng)新大獎TOP55
2025 ASI先鋒產(chǎn)品大獎TOP33
2027年,人工智能或?qū)⒌诌_(dá)ASI臨界點。
當(dāng)通用人工智能的浪潮之巔指向超智能的奇點,一個前所未有的新紀(jì)元正拉開序幕。
為此,新智元將全面開啟對超智能時代的探索,于這片波瀾壯闊的新宇宙中,尋找引領(lǐng)未來的「領(lǐng)航艦」與定義未來的「新智人」。
新智元收集350多家「星艦」資料,依據(jù)「新智元AI Era影響力評估模型」進(jìn)行綜合分析。
評選出2025新智元AI Era企業(yè)和2025ASI產(chǎn)品創(chuàng)新大獎。
新智元2025 AI Era企業(yè)創(chuàng)新大獎TOP55
獲獎企業(yè):
以下排名不分先后
阿里 、字節(jié) 、騰訊、百度、華為、DeepSeek、科大訊飛 、昆侖萬維、智譜、商湯科技、百川智能、MiniMax、月之暗面、快手、微博、階躍星辰、面壁智能、360、螞蟻、智源研究院、浪潮、榮耀、高德、生數(shù)科技、巖芯數(shù)智Rock AI、千尋智能、出門問問、潞晨科技、中科聞歌、上海人工智能實驗室、優(yōu)必選、宇樹科技、聲網(wǎng)、群核科技、智平方、思朗科技、銀河通用、合合信息、無問芯穹、上??茖W(xué)智能研究院、易鑫集團、Akool、Fellou、VAST、YouWare、行云芯片、秘塔科技、云知聲、芯矩開物、中科曙光、人工智能軟硬件協(xié)同創(chuàng)新與適配驗證中心、云天勵飛、梅卡曼德、星動紀(jì)元、追覓科技
2025 ASI先鋒產(chǎn)品大獎TOP33
獲獎產(chǎn)品:
以下排名不分先后
通義千問3、豆包1.6、文心大模型X1 Turbo、秒噠、混元T1、天工超級智能體Skywork Super Agent、昇騰384超節(jié)點(Atlas 900 A3 SuperPoD)、訊飛星火X1、元腦SD200、GLM-4.5、Baichuan-M2、AI微博智搜、MiniMax Agent、Step3、納米AI、AI健康管家AQ、Yan 2.0 Preview、Kimi K2、商湯日日新V6.5多模態(tài)大模型、可靈、悟界·具身大腦RoboBrain 2.0、Vidu Q1、書生Intern-S1、Video Ocean、具身智能機器人Moz1、TicNote、群核空間智能平臺SpatialVerse、四足機器人 Go2、Monkey Code、秘塔AI搜索、ShellAgent、大群空間、松鼠Ai智能老師、齊馭QG800X
駕馭ASI時代的黎明
ASI的到來不再是遙遠(yuǎn)的科幻想象,而是基于數(shù)據(jù)、趨勢與產(chǎn)業(yè)邏輯的必然演進(jìn)。
這是人類文明前所未有的機遇。
從科學(xué)發(fā)現(xiàn)、醫(yī)療突破、能源革命,到數(shù)字世界的重塑,ASI將以指數(shù)級的能力擴張,重寫生產(chǎn)力的邊界。
這也是一次歷史性的挑戰(zhàn)。
今天的每一步探索,都是未來文明的基石。
未來已來,正如2025年新智元前沿趨勢的報告主題所揭示的:新天終啟,萬物智生。
一個由智能創(chuàng)造的新世界正在成型,而我們正站在創(chuàng)世的門檻上。
(報告全文完)
《2025新智元ASI產(chǎn)業(yè)圖譜》解讀
產(chǎn)業(yè)圖譜(Industry Map)本質(zhì)上是一套系統(tǒng)化的可視化方法,用來呈現(xiàn)某一產(chǎn)業(yè)生態(tài)的整體格局。
它將不同類別的參與者(企業(yè)、機構(gòu)、產(chǎn)品、技術(shù)方向等)按照一定的邏輯框架和評價標(biāo)準(zhǔn)進(jìn)行歸納、排序與定位,形成一張「全景地圖」。
在人工智能產(chǎn)業(yè)中,產(chǎn)業(yè)圖譜不僅展示了技術(shù)與產(chǎn)品的表現(xiàn),還刻畫了企業(yè)在生態(tài)、市場與口碑上的綜合地位。
我們采集的數(shù)據(jù)涵蓋LMArena、Artificial Analysis、OpenRouter、LiveBench、Tracking AI和OpenCompass七大權(quán)威榜單,八個分析維度,以及a16z提供的Web與Mobile兩個產(chǎn)品評價榜單。
指標(biāo)分類
首先要解決各類評價指標(biāo)「不同來源、不同量綱不可直接相加」的問題。
我們把全部指標(biāo)分成兩類:
一類是直接給數(shù)值的(共六項:LMArena、Artificial Analysis、OpenRouter、LiveBench、Tracking AI、OpenCompass)
另一類是給排名的(兩項:a16z的Web Products與Mobile Apps)。
指標(biāo)歸一化和加權(quán)
產(chǎn)業(yè)圖譜的計算目標(biāo)是把分類后的指標(biāo)信息都轉(zhuǎn)化成同一百分制的分值。
再按既定權(quán)重相加得到綜合分,方便橫向比較與排序。
第一步:準(zhǔn)備數(shù)據(jù)與統(tǒng)計邊界
對每個「數(shù)值類」維度,只看真實填了數(shù)的樣本,分別統(tǒng)計這一列的最小值、最大值和平均值。
它們構(gòu)成后續(xù)「拉伸到百分制」的參照邊界與均值基線。
比如本批數(shù)據(jù)中,LMArena的最小值是 1368、最大值是 32905;其他列同理各有自己的邊界。
對「排名類」維度,也只看上榜的樣本,確定該列的「最大名次」。
這一步的關(guān)鍵,是所有「尺度化」都圍繞這一批數(shù)據(jù)自身的分布展開,而不是拿外部某個固定閾值強行切割。
第二步:中性地處理缺失
現(xiàn)實數(shù)據(jù)經(jīng)常不完整。我們對「數(shù)值類」指標(biāo)采用「同儕均值填充」:某公司在某一列缺了,就用這列已有樣本的平均值替代。
它的含義是:沒有提供該項,就按同儕的「平均位置」計分,不獎勵、不懲罰。
注意,后續(xù)把這一列拉到百分制時,這個「平均位置」會落到介于零與一百之間的某個具體分值,并不必然正好是五十分,因為這一批樣本可能高于或低于對稱分布。
至于「排名類」,如果沒上榜,就直接計零分;這與「墊底但上榜」明確區(qū)分開來,后者仍然有固定的低分值,而不上榜則完全沒有分。
第三步:把六項「數(shù)值類」壓到百分制
使用極差歸一把數(shù)值類統(tǒng)一到0-100。
做法非常直觀:把這一列的最小值對齊到零分,最大值對齊到一百分,其余各值按在「最小—最大」區(qū)間中的相對位置線性插到零到一百之間。
這樣拉伸之后,同一列的不同公司就有了可直接比較的百分制分?jǐn)?shù)。
像OpenRouter這種原本以百分號字符串提供的數(shù)據(jù),先轉(zhuǎn)成數(shù)值再統(tǒng)一處理即可。
一個邊緣情況是:如果某列全員數(shù)值幾乎一樣,這一列就不具備區(qū)分度,拉伸后的分差也會非常??;在極端情況下(幾乎無差異),這一列對綜合分的貢獻(xiàn)基本接近常數(shù)。
第四步:把兩項「排名類」轉(zhuǎn)成百分制
這里采用一條「前段陡、后段緩」的對數(shù)型曲線來映射名次:第一名給滿分,最后一名固定在較低但非零的分?jǐn)?shù)(這里定在二十分),中間名次按照對數(shù)刻度分配分差。
這樣的刻度有三個直觀效果:
其一,「冠軍優(yōu)勢」會被清晰放大,榜首與次席之間的差距大于次席與第三名,符合真實生態(tài)里「頭部更稀缺」的現(xiàn)象;
其二,越往后分差越小,不會讓長尾名次之間的差別顯得過度夸張;
其三,沒上榜堅決記零分,避免「墊底」和「缺席」被混為一談。
Web與Mobile兩個榜單分別根據(jù)各自的最大名次做刻度,因此能自適應(yīng)當(dāng)期樣本規(guī)模。
以本批數(shù)據(jù)為例:
Web榜(max_rank=46):rank=2 →85.52;rank=10 →51.89;rank=46 →20.00
Mobile榜(max_rank=47):rank=2 →85.60;rank=10 →52.16;rank=47 →20.00
第五步:按權(quán)重合成綜合分
當(dāng)8個指標(biāo)都成為百分制分值之后,就可以加權(quán)求和了。權(quán)重設(shè)計體現(xiàn)了「我們更看重什么」。
在這套方案中:
LiveBench與Artificial Analysis各占兩成
OpenRouter、LMArena、Tracking AI、OpenCompass各占一成
a16z 的 Web 占百分之十二、Mobile 占百分之八
權(quán)重之和嚴(yán)格為一,因此綜合分天然落在零到一百之間。這樣的「凸組合」既不會讓某一個維度「一票否決」,也能通過權(quán)重表達(dá)戰(zhàn)略取舍。
為了更加詳細(xì)的解釋產(chǎn)業(yè)圖譜分值的計算,我們以O(shè)penAI為例。
按上面的統(tǒng)計量和公式,逐項得到標(biāo)準(zhǔn)分:
小提示:你會發(fā)現(xiàn) OpenRouter 這列 OpenAI 得分不高(22.18),但由于其他維度權(quán)重與得分都很高, 綜合分依然領(lǐng)先 。這正是多源多維加權(quán)的意義—— 不看單項、看綜合 。