發(fā)布時間:2025-09-19 來源:不言而信網(wǎng)作者:1001mcc
智東西作者 王涵編輯 漠影
智東西9月9日報道,今天上午,在百度Wave Summit深度學(xué)習(xí)開發(fā)者大會上,百度正式發(fā)布深度思考模型文心大模型X1.1、大模型開發(fā)框架飛槳框架V3.2、智能代碼助手文心快碼3.5S以及一系列開發(fā)組件更新。
相比于深度思考模型文心X1,文心大模型X1.1的事實性能力提升34.8%,指令遵循能力提升12.5%,智能體能力提升9.6%,在多項基準(zhǔn)測試中超越DeepSeek-R1-0528。
目前,用戶可以在文心一言官網(wǎng)、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上線百度智能云千帆平臺,對企業(yè)客戶及開發(fā)者全面開放使用。
一、超越DeepSeek,對標(biāo)GPT-5!百度文心大模型X1.1多項基準(zhǔn)測試獲SOTA
會上,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰正式發(fā)布了文心大模型X1.1深度思考模型。
據(jù)王海峰分享,文心大模型X1是基于文心大模型4.5訓(xùn)練而來的深度思考模型,相比文心X1,文心大模型X1.1的事實性提升34.8%,指令遵循能力提升12.5%,智能體能力提升9.6%。
在權(quán)威基準(zhǔn)評測中,文心大模型X1.1在多個任務(wù)上超越DeepSeek-R1-0528,取得第一名的成績。同時,與國際頂尖模型GPT-5和Gemini 2.5 Pro相比,效果基本持平。
文心大模型X1.1主要采用了迭代式混合強化學(xué)習(xí)訓(xùn)練框架,一方面通過混合強化學(xué)習(xí),同時提升通用任務(wù)和智能體任務(wù)的效果;另一方面通過自蒸餾數(shù)據(jù)的迭代式生產(chǎn)及訓(xùn)練,不斷提升模型整體效果。
在客服場景,文心大模型X1.1可以識別用戶客訴的情緒和需求,通過思考和調(diào)用后臺多個工具,自動完成客訴處理的服務(wù)流程。
基于文心大模型X1.1的基礎(chǔ),百度開發(fā)劇本驅(qū)動多模協(xié)同的數(shù)字人技術(shù),可以通過大語言模型生成劇本,驅(qū)動語音語調(diào)和數(shù)字人的形象,最終形成完善的數(shù)字人。
百度集團副總裁、深度學(xué)習(xí)技術(shù)應(yīng)用及國家工程研究中心副主任吳甜透露,今年6月15日,在百度電商平臺,羅永浩數(shù)字人直播的GMV已經(jīng)超過其本人直播的GMV表現(xiàn)。
數(shù)字人主播的問答轉(zhuǎn)化率和問答接待率都可以超越真人,其超長待機能力在70分鐘以上的場直播中優(yōu)勢明顯。
二、飛槳文心生態(tài)開發(fā)者超2千萬,百度內(nèi)部45%新代碼由AI生成
文心大模型的能力拓展和效率提升,得益于飛槳文心的聯(lián)合優(yōu)化。
大會現(xiàn)場,百度發(fā)布了飛槳核心框架3.2版本,該版本在大模型訓(xùn)練、硬件適配和生態(tài)支持上全面升級。
百度飛槳同步升級了大模型開發(fā)套件ERNIEKit和高效部署套件FastDeploy,還發(fā)布了AI科學(xué)套件,包括智能流體力學(xué)開發(fā)套件和智能材料科學(xué)開發(fā)套件,以及大規(guī)模計算圖數(shù)據(jù)集GraphNet。
據(jù)最新數(shù)據(jù)披露,飛槳文心生態(tài)開發(fā)者達(dá)到2333萬位,服務(wù)企業(yè)達(dá)到76萬家。
AI編程方面,百度還發(fā)布了文心快碼3.5S,新版本的代碼生成準(zhǔn)確率提升26%,其中復(fù)雜場景提升38%??梢择{馭更復(fù)雜的任務(wù)。
據(jù)悉,目前,百度中有45%的新增代碼是AI生成的,文心快碼已累計服務(wù)超過1000萬位開發(fā)者與上千家企業(yè)。
結(jié)語:飛槳文心聯(lián)合優(yōu)化,降低開發(fā)與技術(shù)落地門檻
飛槳與文心的深度聯(lián)合優(yōu)化,持續(xù)推動著文心大模型能力的拓展與效率的提高。文心快碼3.5S的發(fā)布進一步降低了AI編程的門檻,為開發(fā)者與企業(yè)帶來了高效且強大的工具。
在產(chǎn)業(yè)落地層面,無論是數(shù)字人直播還是文心快碼的落地,這些實踐為AI與實體經(jīng)濟融合提供了具體參考路徑,在電商、編程開發(fā)等領(lǐng)域?qū)π袠I(yè)智能化轉(zhuǎn)型產(chǎn)生了實際影響。