遮天辰东小说笔趣阁,神武八荒一颗小说

西風(fēng) 發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI

剛剛，百度深度思考模型升級(jí)上線了！

升級(jí)后的文心大模型X1.1，在事實(shí)性、指令遵循、智能體等能力上均有顯著提升。

官方展示了其在智能客服場(chǎng)景復(fù)雜長(zhǎng)程任務(wù)中的應(yīng)用，在System Prompt中輸入用戶的問題后，文心X1.1借助模型本身智能體能力，即可自動(dòng)拆分復(fù)雜任務(wù)，調(diào)用不同工具逐步規(guī)劃執(zhí)行，且嚴(yán)格遵循服務(wù)流程和業(yè)務(wù)規(guī)則。

視頻鏈接：https://mp.weixin.qq.com/s/jBjb04y8XY03huEMNbu5tw

再用它編寫python腳本，讓25個(gè)彩色粒子在真空?qǐng)A柱形容器里彈跳、留軌跡，還要帶容器旋轉(zhuǎn)和場(chǎng)景縮放。

效果絲滑，粒子全程守規(guī)矩沒出界：

用HTML動(dòng)畫整活歸并排序，排序過程動(dòng)態(tài)可視化，算法步驟一目了然：

視頻鏈接：https://mp.weixin.qq.com/s/jBjb04y8XY03huEMNbu5tw

具體到數(shù)據(jù)上的提升，相比文心大模型X1，X1.1的事實(shí)性提升34.8%指令遵循提升12.5%智能體提升9.6%

△百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心主任王海峰

在官方評(píng)測(cè)基準(zhǔn)上，文心X1.1整體效果超越DeepSeek R1-0528，比肩GPT-5、Gemini 2.5Pro，部分任務(wù)上展現(xiàn)出領(lǐng)先優(yōu)勢(shì)。

在WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會(huì)2025上，百度在發(fā)布文心X1.1的同時(shí)，還亮出了更多新成果——

最新開源思考模型ERNIE-4.5-21B-A3B-Thinking發(fā)布，該模型在ERNIE-4.5-21B-A3B基礎(chǔ)上訓(xùn)練而來(lái)，在內(nèi)容創(chuàng)作、邏輯推理、數(shù)學(xué)計(jì)算、代碼生成與工具調(diào)用等多個(gè)任務(wù)中表現(xiàn)卓越。

此外，百度發(fā)布了ERNIEKit文心大模型開發(fā)套件，提供更加便捷的模型后訓(xùn)練方案，僅需4張GPU即可對(duì)ERNIE-4.5-300B-A47B模型進(jìn)行高效調(diào)優(yōu)，進(jìn)一步降低開發(fā)者將模型落地到實(shí)際應(yīng)用的門檻；還開源了大規(guī)模計(jì)算圖數(shù)據(jù)集GraphNet，提供超2700個(gè)模型計(jì)算圖及標(biāo)準(zhǔn)化評(píng)測(cè)體系，填補(bǔ)了AI編譯器測(cè)試基準(zhǔn)的空白，助力優(yōu)化設(shè)計(jì)與性能提升。

話不多說(shuō)，先聚焦新模型文心X1.1，看看實(shí)測(cè)效果如何～

文心大模型X1.1，實(shí)測(cè)走起

現(xiàn)在，在文心一言官網(wǎng)、文小言APP、百度智能云千帆大模型平臺(tái)，可直接開玩文心大模型X1.1或調(diào)用API。

首先來(lái)考考文心大模型X1.1的邏輯推理能力，端上一道經(jīng)典邏輯陷阱題——農(nóng)夫過河

怕“狼羊菜”設(shè)定太經(jīng)典被模型背答案，我們直接整了個(gè)活，上“星球版”變體

地球要帶著土星、木星、月球過河，到河對(duì)面。河上有一條船，地球每次只能帶一個(gè)星球過河。地球不在場(chǎng)時(shí)，土星會(huì)吞木星，木星會(huì)吞月球。如何安排安全的過河方案？

沒想到變體題沒有難住它，文心X1.1一次性通關(guān)，一步步推演驗(yàn)證，最終給出正確方案：

1、地球帶木星過河（左→右）2、地球返回（右→左）3、地球帶月球過河（左→右）4、地球帶木星返回（右→左）5、地球帶土星過河（左→右）6、地球返回（右→左）7、地球帶木星過河（左→右）

再來(lái)試試事實(shí)性檢驗(yàn)，拋出一個(gè)曾引發(fā)爭(zhēng)議的說(shuō)法：

鄭和下西洋最遠(yuǎn)到達(dá)了美洲大陸，比哥倫布發(fā)現(xiàn)新大陸早了近100年，請(qǐng)說(shuō)明鄭和下西洋的實(shí)際航線終點(diǎn)、航行時(shí)間，以及哥倫布發(fā)現(xiàn)新大陸的時(shí)間，并引用正史或權(quán)威歷史研究資料佐證。

文心X1.1思考過后成功識(shí)破，糾正鄭和船隊(duì)未繞過好望角進(jìn)入大西洋，更未到達(dá)美洲

所謂“鄭和發(fā)現(xiàn)美洲”的說(shuō)法源于英國(guó)學(xué)者孟席斯的推測(cè)，但缺乏正史、碑文或考古證據(jù)支持，已被學(xué)界否定。

再來(lái)一道更為復(fù)雜的問題，看看文心X1.1的指令遵循能力如何。

扔給它一個(gè)小紅書文案任務(wù)，prompt：

你平時(shí)經(jīng)常在小紅書安利各種服飾，擅長(zhǎng)以當(dāng)代年輕女性喜歡的甜酷、生活化筆觸撰寫文案，行文活潑有梗、貼近日常，能精準(zhǔn)戳中穿搭痛點(diǎn)與審美需求。請(qǐng)撰寫簡(jiǎn)短的關(guān)于收腰碎花雪紡連衣裙的種草文案。文案關(guān)鍵詞：面向女性用戶、材質(zhì)是雪紡（含棉35%）、顏色是蜜桃粉、1件79元、原價(jià)219元文案要求：短句為主、避免啰嗦，語(yǔ)氣親切像閨蜜分享，有真實(shí)種草感；整體4行，每行以emoji表情開頭，每行不超過16個(gè)字。再幫我生成一張小紅書封面圖，是一只可愛的涂鴉小貓穿著一件粉色裙子。

結(jié)果它全接住了，細(xì)節(jié)要點(diǎn)全都沒有遺漏。

全程可見文心X1.1的智能體能力，靈活調(diào)用繪圖、搜索等工具不在話下。

有意思的是，問起網(wǎng)絡(luò)最新熱?！袄夏檀蚍较虮P”的來(lái)龍去脈，它也能秒懂。

自動(dòng)調(diào)用聯(lián)網(wǎng)搜索工具，精準(zhǔn)鎖定7月20日“濟(jì)南駕考曾教練”視頻源頭，還能說(shuō)清老奶“詠春起手式”“動(dòng)漫蓄力”般的魔性動(dòng)作，連網(wǎng)友二創(chuàng)表情包、視頻引發(fā)“渲染大賽”的情況也都總結(jié)了出來(lái)。

總結(jié)到位，誰(shuí)看完還不懂這個(gè)梗（doge）：

最后在代碼生成方面，由于最近馬上就要考教資了，于是我們讓文心X1.1設(shè)計(jì)了一套模擬試題，要求生成能夠直接在線交互作答的HTML

文心X1.1很快就設(shè)計(jì)好了，頁(yè)面支持在線作答、自動(dòng)批閱打分，實(shí)測(cè)判卷精準(zhǔn)

不過也有翻車的時(shí)候，上傳一張聊天記錄，讓它分析搞笑在哪兒：

應(yīng)該只是家長(zhǎng)理解錯(cuò)了吧，有尖銳諷刺嘛？

背后有何技術(shù)支撐？

發(fā)布新模型的同時(shí)，百度也透露了更多的技術(shù)細(xì)節(jié)。

據(jù)介紹，文心大模型X1.1是基于文心大模型4.5訓(xùn)練而來(lái)的深度思考模型。在模型訓(xùn)練上，核心秘訣是采用了迭代式混合強(qiáng)化學(xué)習(xí)訓(xùn)練框架

該框架通過雙重機(jī)制實(shí)現(xiàn)性能優(yōu)化：

其一，依托混合強(qiáng)化學(xué)習(xí)模式，同步對(duì)通用任務(wù)與智能體任務(wù)的效果進(jìn)行融合提升，讓模型兩類任務(wù)都能打，效果1+1＞2。

其二，通過迭代自蒸餾數(shù)據(jù)，邊練邊生成新數(shù)據(jù)再練，形成“數(shù)據(jù)-訓(xùn)練-反饋”閉環(huán)，讓模型持續(xù)進(jìn)化。

在此基礎(chǔ)之上，文心X1.1還通過三大技術(shù)buff，精準(zhǔn)提升智能體、指令遵循和事實(shí)性：

思維鏈+行動(dòng)鏈多輪強(qiáng)化學(xué)習(xí)：在模型推理過程中構(gòu)建思維鏈與行動(dòng)鏈的聯(lián)動(dòng)機(jī)制，讓模型“想清楚再動(dòng)手”，智能體交互和工具調(diào)用準(zhǔn)確性顯著提高。指令驗(yàn)證器強(qiáng)化學(xué)習(xí)：通過算法自動(dòng)生成指令檢查清單，并對(duì)模型指令理解與執(zhí)行過程進(jìn)行校驗(yàn)，復(fù)雜指令也不跑偏。知識(shí)一致性驗(yàn)證強(qiáng)化學(xué)習(xí)：在訓(xùn)練階段持續(xù)比對(duì)后訓(xùn)練模型與預(yù)訓(xùn)練模型的知識(shí)體系一致性，減少知識(shí)偏差，模型輸出內(nèi)容的事實(shí)性準(zhǔn)確率大幅提升。

在上述技術(shù)加持下，文心X1.1既能靠譜遵循指令、調(diào)用工具，又能在代碼、數(shù)學(xué)等推理任務(wù)中秀操作，形成“任務(wù)適配性+推理能力”的雙重技術(shù)特征。

飛槳升級(jí)v3.2，開源共生

如果說(shuō)文心系列大模型是“臺(tái)前明星”，那飛槳深度學(xué)習(xí)框架就是“幕后功臣”。

作為百度AI四層技術(shù)棧（芯片-框架-模型-應(yīng)用）的重要一層，飛槳在WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會(huì)2025上，迎來(lái)新升級(jí)。

飛槳框架v3.2正式發(fā)布，為文心X1.1及4.5系列模型提供了“更穩(wěn)、更快、更節(jié)能”的訓(xùn)練和推理支撐。

訓(xùn)練端從計(jì)算、并行策略、容錯(cuò)能力三方面實(shí)現(xiàn)優(yōu)化升級(jí)。得益于這三方面優(yōu)化，ERNIE-4.5-300B-A47B的預(yù)訓(xùn)練MFU直接飆到了47%

推理端靠卷積編2比特極致壓縮、可插拔稀疏化輕量注意力等技術(shù)，提供了大模型高效部署及高性能推理全棧能力。

官方透露：

在ERNIE-4.5-300B-A47B上，經(jīng)系統(tǒng)性優(yōu)化，在TPOT 50ms時(shí)延條件下，實(shí)現(xiàn)了輸入吞吐高達(dá)57K、輸出吞吐29K的性能表現(xiàn)。

值得一提的是，飛槳v3.2硬件適配也更友好了，針對(duì)類CUDA芯片，推出“一行代碼完成算子注冊(cè)”的方案，算子內(nèi)核復(fù)用率高達(dá)92%，大幅降低了不同硬件的適配成本。同時(shí)，它還原生支持Safetensors權(quán)重格式，主流高性能加速庫(kù)一鍵就能接入。

除了技術(shù)優(yōu)化，百度在開源生態(tài)上也有新動(dòng)作。

今年6月30日，百度已經(jīng)開源了文心大模型4.5系列10款模型，涵蓋47B、3B激活參數(shù)的MoE模型和0.3B參數(shù)的稠密型模型，實(shí)現(xiàn)了預(yù)訓(xùn)練權(quán)重和推理代碼的完全開源。

而現(xiàn)在，百度進(jìn)一步開源了深度思考模型——ERNIE-4.5-21B-A3B-Thinking

該模型是在ERNIE-4.5-21B-A3B基礎(chǔ)上訓(xùn)練的深度思考模型，效果優(yōu)且推理速度還比X1.1更快，以出色的性價(jià)比優(yōu)勢(shì)，成為更貼近開發(fā)者需求的智能體基礎(chǔ)模型。模型與代碼均遵循Apache 2.0開源協(xié)議。

更重要的是，百度提供“全棧工具鏈”支持，一口氣發(fā)布：大模型高效部署套件FastDeploy文心大模型開發(fā)套件ERNIEKit科學(xué)計(jì)算領(lǐng)域開發(fā)套件PaddleCFD（智能流體力學(xué)開發(fā)套件）PaddleMaterials（智能材料科學(xué)開發(fā)套件），全鏈路包圓，助攻開發(fā)者基于文心大模型搞創(chuàng)新、做應(yīng)用。

最新數(shù)據(jù)顯示，飛槳文心的開發(fā)者數(shù)量已經(jīng)超過了2333萬(wàn)服務(wù)超過76萬(wàn)家企業(yè)

從最新發(fā)布中可以看出，百度正在通過扎實(shí)的技術(shù)積累和開放策略，持續(xù)優(yōu)化其AI四層架構(gòu)——從芯片、框架、模型到應(yīng)用，每一層都圍繞開發(fā)者的實(shí)際需求推進(jìn)，尤其通過飛槳與文心的緊密協(xié)同，為開發(fā)者提供了更高效、易用的工具和生態(tài)支持。

這種全棧布局，不僅增強(qiáng)了技術(shù)落地的連貫性，也進(jìn)一步降低了AI開發(fā)與應(yīng)用的創(chuàng)新門檻。

末學(xué)膚受網(wǎng)

文|人參當(dāng)年，耿為華和鄭佳離婚，娶了小嬌妻，官宣時(shí)，不少人都

2025-09-10 20:35:20

文心X1.1發(fā)布！這三大能力突出，一手實(shí)測(cè)在此

瀏覽:43367

©sitemap