9月19日,首款全棧國(guó)產(chǎn)化深度推理大模型“紫東太初”4.0在武漢發(fā)布,具備“邊看、邊識(shí)、邊思”的類(lèi)人多模態(tài)推理認(rèn)知能力,特別是在帶圖思考多模態(tài)復(fù)雜推理和工具調(diào)用的能力上,全面超過(guò)了GPT5。
2024年圖靈獎(jiǎng)得主理查德·薩頓表示,人類(lèi)數(shù)據(jù)正在迅速接近極限,智能體將越來(lái)越多通過(guò)與世界交互而獲得持續(xù)學(xué)習(xí)的能力,潛力遠(yuǎn)超以往。
中國(guó)科學(xué)院自動(dòng)化研究所副總工程師、武漢人工智能研究院院長(zhǎng)王金橋在接受第一財(cái)經(jīng)記者采訪時(shí)介紹,從3.0原生的多模態(tài)統(tǒng)一框架到4.0多模態(tài)細(xì)膩度的復(fù)雜思考,紫東太初完成了國(guó)產(chǎn)大模型從“純文本思考”“簡(jiǎn)單操作帶圖思考”到“細(xì)粒度多模態(tài)語(yǔ)義思考”的三重躍遷。
以推理“贏得一場(chǎng)斯洛克需要幾步”為例,“紫東太初”4.0通過(guò)輸入的圖片可先定位白球、粉球和紅球的位置,再通過(guò)臺(tái)上不同球的得分進(jìn)行復(fù)雜的推理和數(shù)學(xué)計(jì)算,進(jìn)一步告訴大家他要做5桿斯洛克才能贏得這場(chǎng)球。
“紫東太初4.0從理解能力、模態(tài)推理、動(dòng)態(tài)推理三大能力引入了類(lèi)人的交叉注意力機(jī)制,使大模型能夠像人一樣,實(shí)現(xiàn)對(duì)世界的理解從全局到局部再到上下文交互式的思考過(guò)程?!蓖踅饦蛘f(shuō),通過(guò)視覺(jué)注意力關(guān)注到某一個(gè)區(qū)域,然后進(jìn)行平移、放大、旋轉(zhuǎn)、增強(qiáng)等一系列操作來(lái)模仿人類(lèi)對(duì)世界探索的過(guò)程,使得模型從被動(dòng)分析邁入到主動(dòng)思考的新階段。
在視頻多模態(tài)2AG應(yīng)用上,“紫東太初”4.0能夠?qū)崿F(xiàn)180分鐘長(zhǎng)視頻的深度理解,細(xì)膩度片段定位和內(nèi)容自動(dòng)分析、總結(jié),在視頻問(wèn)答、細(xì)膩度檢索和文檔檢索等6項(xiàng)任務(wù)中達(dá)到SOTA(State-of-the-art的簡(jiǎn)稱(chēng),常用于衡量大模型性能的基準(zhǔn))的性能。
王金橋表示,在多模態(tài)推理、邏輯思維和智能體上,“紫東太初”4.0全面對(duì)標(biāo)了GPT4.1nano和GPT4O等先進(jìn)模型,在帶圖思考多模態(tài)復(fù)雜推理和工具調(diào)用上,則全面超過(guò)了GPT5。
不僅僅是QA問(wèn)答智能體升級(jí),紫東太初4.0將以更高性能賦能實(shí)體經(jīng)濟(jì),包括工業(yè)智能、具身智能、醫(yī)療智能等。王金橋向第一財(cái)經(jīng)記者介紹,以紫東太初與華工科技合作的高精度激光焊接技術(shù)為例,相比3.0版本,紫東太初4.0具備更強(qiáng)的空間交互能力,推理速度約可提升15%左右。這就意味著,華工科技當(dāng)前每43秒完成一輛新能源汽車(chē)車(chē)身的激光焊接速度,有望再次實(shí)現(xiàn)提升。
除此之外,“紫東太初”4.0還具有三大核心技術(shù)創(chuàng)新。王金橋進(jìn)一步表示,一是低成本、高覆蓋的真實(shí)事件多決策的數(shù)據(jù)合成和增強(qiáng),保證了訓(xùn)練效果。二是批判式的多輪反思學(xué)習(xí),知可行也知不可行,遇到困難的時(shí)候可以退回來(lái)?yè)Q一條路,不斷嘗試來(lái)解決問(wèn)題。三是難度敏感的自適應(yīng)強(qiáng)化學(xué)習(xí),通過(guò)從簡(jiǎn)單體再到復(fù)雜體再到困難體,層級(jí)漸進(jìn)式訓(xùn)練保證訓(xùn)練效率和模型的穩(wěn)定性。同時(shí)這三大技術(shù)能力保證了訓(xùn)練的效率和推理性能的顯著提升,相較“紫東太初”3.0,整體提升了15%左右。
為推動(dòng)紫東太初4.0的技術(shù)優(yōu)勢(shì)轉(zhuǎn)化為實(shí)際產(chǎn)業(yè)價(jià)值,“紫東太初云”平臺(tái)亦同步發(fā)布。武漢人工智能研究院副院長(zhǎng)張家俊表示,紫東太初云是國(guó)內(nèi)首個(gè)多模態(tài)大模型原生協(xié)同云,也是首個(gè)全棧國(guó)產(chǎn)化萬(wàn)卡智算云。涵蓋算力服務(wù)、大模型訓(xùn)推、應(yīng)用開(kāi)發(fā)、具身智能四大核心板塊,面向企業(yè)提供從算力支撐、平臺(tái)服務(wù)到應(yīng)用落地的全鏈路能力。上線后,該平臺(tái)將運(yùn)用全棧AI能力深入賦能企業(yè)核心業(yè)務(wù),立足湖北優(yōu)勢(shì)產(chǎn)業(yè)打造一批標(biāo)桿案例,與合作伙伴共同推動(dòng)大模型能力轉(zhuǎn)化為產(chǎn)業(yè)動(dòng)能,為我國(guó)現(xiàn)代畫(huà)產(chǎn)業(yè)體系智能化轉(zhuǎn)型貢獻(xiàn)力量。
發(fā)布現(xiàn)場(chǎng),武漢人工智能研究院與四川并濟(jì)科技有限公司等5家企業(yè)共同啟動(dòng)“十萬(wàn)卡多模態(tài)大模型異構(gòu)智能訓(xùn)練平臺(tái)”,為大模型技術(shù)加速迭代升級(jí)提供技術(shù)支持。
全國(guó)政協(xié)委員、中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員張?jiān)迫硎?,中?guó)當(dāng)前已進(jìn)入算力經(jīng)濟(jì)時(shí)代,算力與數(shù)據(jù)、算法共同構(gòu)成數(shù)字經(jīng)濟(jì)時(shí)代的關(guān)鍵資源,其經(jīng)濟(jì)拉動(dòng)效應(yīng)顯著,要推動(dòng)人工智能技術(shù)快速迭代與廣泛應(yīng)用。
關(guān)于我們|版權(quán)聲明| 違法和不良信息舉報(bào)電話:010-84151598 | 網(wǎng)絡(luò)敲詐和有償刪帖舉報(bào)電話:010-84151598
Copyright ? 2008-2024 by {當(dāng)前域名}. all rights reserved