點擊右上角微信好友
朋友圈
請使用瀏覽器分享功能進行分享
在大模型狂飆兩年之后,行業(yè)進入“應(yīng)用見真章”的階段。在 2025 騰訊全球數(shù)字生態(tài)大會上,騰訊云發(fā)布數(shù)據(jù)庫AI服務(wù),其中有多款智能體——SQL 事前風險預(yù)測、DDL 變更風險評估、高負載止損值守等。
數(shù)據(jù)庫領(lǐng)域可以開發(fā)智能體的方向也有很多,騰訊云為什么會選擇從 SQL 風險治理入手?騰訊云數(shù)據(jù)庫副總經(jīng)理羅云對雷峰網(wǎng)表示,主要因為這是最痛點、最難解決的環(huán)節(jié)?!?024 到 2025 年,我們每個月都觀察到有客戶因為 SQL 使用不當,導(dǎo)致數(shù)據(jù)庫出現(xiàn)風險事件?!?/p>
騰訊云講述過一個案例:在一次交易數(shù)據(jù)清理過程中,由于一條優(yōu)化不當?shù)?SQL 語句遺漏了關(guān)鍵索引,導(dǎo)致核心交易表被全表掃描。問題發(fā)生在交易時段,瞬間引發(fā)大量指令受阻,訂單提交接連超時,部分跨境交易也因此受到影響。最終,依靠風控系統(tǒng)的緊急處理才避免了更大范圍的系統(tǒng)癱瘓。
為何 SQL 使用不到風險如此之高呢?其中根因源于,數(shù)據(jù)庫的開發(fā)者與 DBA 之間,長期存在一道難以逾越的“認知鴻溝”。
開發(fā)團隊熟悉業(yè)務(wù)邏輯和代碼,常通過 ORM 框架生成 SQL,卻對底層數(shù)據(jù)庫運行機制了解有限;DBA 則精通數(shù)據(jù)庫內(nèi)核和 SQL 優(yōu)化,但難以在開發(fā)環(huán)節(jié)進行前置干預(yù)。結(jié)果是,一旦風險 SQL 引發(fā)故障,DBA 往往只能被動“救火”,而根源難以追溯。
今年 2、3 月開始,騰訊云數(shù)據(jù)庫團隊開啟了智能體的開發(fā),就是試圖解決的是開發(fā)者與數(shù)據(jù)庫管理員(DBA)之間長期存在的“鴻溝”,羅云談到。
SQL 事前風險預(yù)測智能體,就像提交前的“安全檢查員”,提前發(fā)現(xiàn)可能讓數(shù)據(jù)庫變慢或出問題的 SQL,提醒開發(fā)者修改。DDL 變更風險評估智能體,像改動前的“模擬演練教練”,先測試數(shù)據(jù)庫結(jié)構(gòu)變更是否會影響系統(tǒng)穩(wěn)定,讓風險在上線前被發(fā)現(xiàn)。高負載止損值守智能體,像數(shù)據(jù)庫的“安全衛(wèi)士”,實時監(jiān)控,當系統(tǒng)壓力過大時自動采取保護措施,避免業(yè)務(wù)崩潰。
據(jù)羅云對雷峰網(wǎng)透露,智能體的開發(fā),底下依托的是垂直數(shù)據(jù)庫大模型,并結(jié)合全域上下文和工具集三大基座。
騰訊云的垂直數(shù)據(jù)庫大模型的自研最早可以追溯到2023 、2024年,一開始他們通過有監(jiān)督微調(diào)(SFT)補課專業(yè)能力,靠人工標注數(shù)據(jù)搭起基礎(chǔ),2025 年 DeepSeek 出現(xiàn)后,全面轉(zhuǎn)向強化學(xué)習(xí),用更復(fù)雜的獎勵機制逼迫模型自我優(yōu)化。
當然,這過程中也遇到過不少的難點,比如做 SFT(有監(jiān)督微調(diào))的難點是語料和數(shù)據(jù)集,團隊需要大量人工投入,對每一個案例進行標注:哪些 SQL 或代碼生成是正確的,哪些是不符合要求的。這個數(shù)據(jù)標注過程非常耗時,但決定了模型在專業(yè)任務(wù)上的基礎(chǔ)能力。
強化學(xué)習(xí)(Reinforcement Learning) 重點在于獎勵模型的設(shè)計。在強化學(xué)習(xí)中,模型每一次輸出都需要評估:是“做得更好”還是“退步了”?團隊花了很多時間設(shè)計算法和評分機制,去判斷每一次生成的 Token 的質(zhì)量,從而讓模型在實際使用中不斷優(yōu)化。
目前這這些智能體已經(jīng)在騰訊內(nèi)部多部門使用,對外客戶目前也在同步進行交流中,預(yù)計明年會對外服務(wù)。
對于智能體的商業(yè)化問題,羅云認為,不要從短期市場規(guī)模出發(fā),而是押注長期戰(zhàn)略價值。羅云判斷,數(shù)據(jù)庫智能體未來真正的商業(yè)回報不在“風險防控”本身,而在兩個方向:第一是,Data Insight:幫企業(yè)“淘金”,挖掘數(shù)據(jù)價值,付費意愿遠高于守住底線;第二是智能體支持套件:當甲方通過智能體賺錢后,配套工具的變現(xiàn)空間巨大。
在數(shù)據(jù)庫產(chǎn)品線宣布推出Agent 之前,幾乎所有產(chǎn)品都在探索AI,一方面將 AI 的功能加入到原有的產(chǎn)品中,比如在騰訊會議中加入了實時 AI 紀要功能,另一方面正在開發(fā)更多的 AI 原生應(yīng)用,比如說CodeBuddy ima等已經(jīng)對外推出,分別應(yīng)用于企業(yè)開發(fā)、知識庫管理。
那么,為什么騰訊會選擇在今年加速布局智能體?
羅云認為,這與時機密切相關(guān)。早一年做可能還不合適,因為當時底層大模型還在快速迭代,應(yīng)用層開發(fā)容易因模型變化被推倒重來。而如今大模型迭代速度趨于平緩,應(yīng)用開發(fā)更穩(wěn)定可控。
在這樣的技術(shù)判斷下,上半年騰訊內(nèi)部掀起了一場智能體開發(fā)熱潮:各條產(chǎn)品線結(jié)合自身場景和行業(yè)特點,積極探索 Agent 應(yīng)用。而眼下,數(shù)據(jù)庫團隊推出的智能體,也正是這種內(nèi)外部因素共同作用的產(chǎn)物。