0
在大模型狂飆兩年之后,行業進入“應用見真章”的階段。在 2025 騰訊全球數字生態大會上,騰訊云發布數據庫AI服務,其中有多款智能體——SQL 事前風險預測、DDL 變更風險評估、高負載止損值守等。
數據庫領域可以開發智能體的方向也有很多,騰訊云為什么會選擇從 SQL 風險治理入手?騰訊云數據庫副總經理羅云對雷峰網表示,主要因為這是最痛點、最難解決的環節。“2024 到 2025 年,我們每個月都觀察到有客戶因為 SQL 使用不當,導致數據庫出現風險事件。”
騰訊云講述過一個案例:在一次交易數據清理過程中,由于一條優化不當的 SQL 語句遺漏了關鍵索引,導致核心交易表被全表掃描。問題發生在交易時段,瞬間引發大量指令受阻,訂單提交接連超時,部分跨境交易也因此受到影響。最終,依靠風控系統的緊急處理才避免了更大范圍的系統癱瘓。
為何 SQL 使用不到風險如此之高呢?其中根因源于,數據庫的開發者與 DBA 之間,長期存在一道難以逾越的“認知鴻溝”。
開發團隊熟悉業務邏輯和代碼,常通過 ORM 框架生成 SQL,卻對底層數據庫運行機制了解有限;DBA 則精通數據庫內核和 SQL 優化,但難以在開發環節進行前置干預。結果是,一旦風險 SQL 引發故障,DBA 往往只能被動“救火”,而根源難以追溯。
今年 2、3 月開始,騰訊云數據庫團隊開啟了智能體的開發,就是試圖解決的是開發者與數據庫管理員(DBA)之間長期存在的“鴻溝”,羅云談到。
SQL 事前風險預測智能體,就像提交前的“安全檢查員”,提前發現可能讓數據庫變慢或出問題的 SQL,提醒開發者修改。DDL 變更風險評估智能體,像改動前的“模擬演練教練”,先測試數據庫結構變更是否會影響系統穩定,讓風險在上線前被發現。高負載止損值守智能體,像數據庫的“安全衛士”,實時監控,當系統壓力過大時自動采取保護措施,避免業務崩潰。
據羅云對雷峰網(公眾號:雷峰網)透露,智能體的開發,底下依托的是垂直數據庫大模型,并結合全域上下文和工具集三大基座。
騰訊云的垂直數據庫大模型的自研最早可以追溯到2023 、2024年,一開始他們通過有監督微調(SFT)補課專業能力,靠人工標注數據搭起基礎,2025 年 DeepSeek 出現后,全面轉向強化學習,用更復雜的獎勵機制逼迫模型自我優化。
當然,這過程中也遇到過不少的難點,比如做 SFT(有監督微調)的難點是語料和數據集,團隊需要大量人工投入,對每一個案例進行標注:哪些 SQL 或代碼生成是正確的,哪些是不符合要求的。這個數據標注過程非常耗時,但決定了模型在專業任務上的基礎能力。
強化學習(Reinforcement Learning) 重點在于獎勵模型的設計。在強化學習中,模型每一次輸出都需要評估:是“做得更好”還是“退步了”?團隊花了很多時間設計算法和評分機制,去判斷每一次生成的 Token 的質量,從而讓模型在實際使用中不斷優化。
目前這這些智能體已經在騰訊內部多部門使用,對外客戶目前也在同步進行交流中,預計明年會對外服務。
對于智能體的商業化問題,羅云認為,不要從短期市場規模出發,而是押注長期戰略價值。羅云判斷,數據庫智能體未來真正的商業回報不在“風險防控”本身,而在兩個方向:第一是,Data Insight:幫企業“淘金”,挖掘數據價值,付費意愿遠高于守住底線;第二是智能體支持套件:當甲方通過智能體賺錢后,配套工具的變現空間巨大。
在數據庫產品線宣布推出Agent 之前,幾乎所有產品都在探索AI,一方面將 AI 的功能加入到原有的產品中,比如在騰訊會議中加入了實時 AI 紀要功能,另一方面正在開發更多的 AI 原生應用,比如說CodeBuddy ima等已經對外推出,分別應用于企業開發、知識庫管理。
那么,為什么騰訊會選擇在今年加速布局智能體?
羅云認為,這與時機密切相關。早一年做可能還不合適,因為當時底層大模型還在快速迭代,應用層開發容易因模型變化被推倒重來。而如今大模型迭代速度趨于平緩,應用開發更穩定可控。
在這樣的技術判斷下,上半年騰訊內部掀起了一場智能體開發熱潮:各條產品線結合自身場景和行業特點,積極探索 Agent 應用。而眼下,數據庫團隊推出的智能體,也正是這種內外部因素共同作用的產物。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。