0

眼下,AI辦公智能體正在迎來最熱切的期待與審視。
2024年“大模型吞噬軟件”論斷震驚全球科技圈,讓人們不得不正視:傳統軟件正在被以大模型為核心的新形態所顛覆。
而這一“新形態”最直接的體現便是以“自主決策、任務閉環”為核心的智能體。它推動了生產力工具從“功能堆砌”轉向“任務驅動”,把人從繁雜的軟件操作中解放出來,打通人與任務間的“最后一公里”。
這場革新中,辦公領域因數字化滲透最深、場景最廣、離生產力一線最近,成了變革的核心試驗場,也承載著人們的熱切與審視:智能體在辦公場景的“核心價值”是什么?何為“可用”與“好用”的智能體?從“可用”到“好用”的跨越,又需要哪些關鍵技術與經驗支撐?
上周,商湯科技舉行了2025產品發布周。重新定義“AI原生辦公”——“辦公小浣熊3.0”為行業帶來了新范本。
事實上,傳統辦公模式長期受制于“軟件驅動” 的桎梏,因為其底層邏輯是: “人要去適配工具、遷就工具”。
比如,職場人需在多款軟件間頻繁切換,手動完成數據錄入、格式調整、信息同步等重復性工作,工作流被切割成一個個碎片化的操作環節。一個完整的任務往往要跨越多個平臺,不僅消耗大量時間成本,也容易因人為操作失誤而導致效率損耗。
這種模式下,工具成了“核心”,人反而成了被動的操作者,大量的創造力與決策價值都被繁瑣的流程稀釋掉了。這也是傳統辦公場景下長久存在的隱痛。
AI辦公智能體正在改變這種現狀。
但人們發現,不少產品距離用戶期待的“好用” 還有不小差距。有用戶曾向雷峰網(公眾號:雷峰網)反饋:“在一些國外技術論壇里,有不少乍一看讓人眼前一亮的 Aha moment 產品,但實際體驗下來卻效果一般。”
人們想要一款“好用”的AI辦公智能體,但“豐滿的理想”下,現實情況往往很復雜。
互聯網公司市場部經理李萌對此感觸頗深。她們的市場團隊每天要對接五花八門的信息——既有銷售端傳來的Excel數據,又有活動策劃的Word方案,還有客戶投訴的聊天截圖,甚至是競品分析的PDF報告。
最頭疼的就是做營銷復盤時,得把Excel里的數據、微信里的客戶反饋、PPT里的活動亮點全湊到一起,光是整理素材就要耗大半天。
“之前用AI幫忙做復盤,文件一雜、信息一亂,它就抓不住重點,要么只羅列數據沒結論,要么漏了關鍵的客戶意見,根本達不到直接用的程度。”李萌無奈道。
在不少C端用戶眼里,以往的AI辦公產品同樣存在不夠好用的現象。
“過去的AI做PPT,總離直接落地差口氣——生成的往往只是文字堆砌的初稿,沒有清晰的邏輯框架,還缺少適配的圖表和配圖。”
比如要準備一份新產品宣講PPT,即便提供了產品數據、客戶需求、競品分析等信息,AI也只是簡單羅列內容,既梳理不出層層遞進的邏輯,也不會自動將數據轉化為直觀圖表。
最終輸出的PPT,還需要用戶花大量時間調整結構、優化版式、補充素材,無法直接拿去使用,跨不過“最后一公里”的交付門檻。
類似的情況還有很多。
這時候,“好用”的AI辦公“搭子”到底應該是什么樣的?
李萌在使用了小浣熊3.0這款辦公智能體后,有了自己的答案。
在月度增長復盤場景下,面對李萌團隊的困境,小浣熊能讀懂深層需求,自動拆解任務,整合 Excel 數據、分析報告等多源資料,直接輸出含數據圖表、結論明確的復盤報告和完整 PPT,李萌稍作確認即可直接使用,省去繁瑣打磨。
在PPT交付場景下,小浣熊構建了一套多模態智能體創作引擎,把PPT制作從“幫著排版”直接拉到了“自己能做”的水平。
它能吃透用戶零散信息背后的真實需求,規劃好完整結構,直接生成PPT——絕非簡單文字堆砌,而是已統籌好大綱、版式,還會自動匹配圖片、生成圖表,最終交付專業且可直接討論的成品。同時小浣熊3.0還具備類似人的 “記憶” 機制,能記住用戶的偏好和風格,讓后續的輸出更貼合用戶個人習慣。
而針對用戶經常出差、路上使用電腦不便的場景,商湯小浣熊3.0還將在近期推出移動端APP,讓用戶在手機上也能延續電腦端的工作流程,變成一個永遠在線的口袋助理。
而這種從聽懂“指令”到理解“任務”,從給個“草稿”到交付“成果”,從困在“單點”到融入“全域”工作流,正是近期商湯小浣熊從2.0升級到3.0版本后實現的“三大能力躍遷”。
而這背后并非單純的技術迭代,也包含了對辦公本質的深度思考。
商湯科技小浣熊負責人賈安亞告訴雷峰網,在研發之初,團隊就在思考:“什么是大模型時代的 AI 辦公?我們到底想做一個什么樣的 AI?”
“我們的答案非常明確:第一,我們不做冷冰冰的工具,而是要做能幫你進入“工作心流”的伙伴。第二,我們不做博眼球的demo,而是扎根用戶的真實場景,解決真問題。”
正是基于這一思考,過去兩年間,小浣熊從1.0到3.0一路走來,不斷升級。
雷峰網對比發現,與市面上大部分AI辦公智能體相比,小浣熊3.0的優勢體現在以下三點:
一是,超強的理解與數據分析能力。最早的小浣熊1.0版本——國內首個數據分析智能體,其擅長的就是做復雜的多模態數據分析,并且得到了不錯的市場反饋。小浣熊3.0更支持了百萬級數據量處理,及多模態多源數據分析。
其二,100分的成果交付能力。小浣熊3.0依托商湯日日新Agentic RL(智能體強化學習)技術實現了端到端復雜任務規劃與閉環能力。尤其它建立更好的交互反饋與人機協作模式,讓所有過程、結果都可編輯,實現了可控輸出,讓95分的成果升級100分交付。
第三,移動端APP上線后,更補全了最后一塊跨平臺處理的拼圖。讓它能更好地實現全流程一站式辦公,融入企業工作流。
這其中,小浣熊 3.0 依托的商湯日日新Agentic RL是商湯科技在模型底層技術上的重要突破。
“我們去年大部分時間專注于數據分析,在單模態與多模態領域實現突破;今年上半年則聚焦復雜任務,深耕推理、拆解能力及智能體技術,完成了重大突破。”賈安亞透露。
具體來說, Agentic RL解決了三大核心技術挑戰:
一是會“一步步琢磨”的長程推理。
面對圖片、文字、文檔這些雜亂的多類數據,"小浣熊"不再是簡單的模式匹配,而是擁有了像“思維鏈”一樣的自主規劃能力,能把一個模糊的分析目標(比如“做一份產品銷售分析”),拆成“整理數據→提煉關鍵信息→做圖表→驗證結論”等幾十個清晰步驟,還能一直記住前后邏輯,不跑偏。
二是,每一步都“自我檢查”的價值對齊。
不同于在多模態分析的每一步中,無論是提取PPT文件的頁面數據,還是編寫一段Python分析代碼,Agentic RL的Reward系統都會實時評估當前步驟動作的價值。
目前主流的強化學習僅對最終結果進行獎勵,而小浣熊引入了細粒度的過程監督——不管是從PPT里提數據,還是寫一段分析代碼,每做完一步都會實時“打分”,判斷這步做得對不對、有沒有用。
這使得模型具備了一定的自我反思能力,對于中間步驟出現偏差,它能進行自我修正并重新規劃計劃,大幅降低了模型的幻覺率。
三是,環境交互與閉環進化。
簡單來說,小浣熊在處理任務時,會不斷和數據工具互動,根據反饋調整做事方法(比如這次圖表做反了,下次就自動修正)。這種機制讓模型能夠從錯誤中學習,實現推理能力的端到端的持續進化。
此外,針對PPT生成場景,小浣熊3.0專門研發了多模態智能體創作引擎,通過解耦內容與樣式,實現高質量、可直接交付的自主創作。
而小浣熊3.0能做到這些,背后還有著更深層次的壁壘支撐。
賈安亞告訴雷峰網,在AI辦公智能體的進化上,單點技術優勢難以持久,小浣熊真正的核心優勢,是技術層、產品層、落地方案執行層聯動的組織化系統工程能力,而這背后是商湯十多年的沉淀。
比如,小浣熊兼具 B、C 兩端屬性,其中 To B 屬性方面,就依托了商湯在 To B 場景十年的深耕與積累,再加上小浣熊自身過去兩年間服務 300 多萬個人用戶與 1000 多家企業用戶的實踐,有教育版、金融版、政務版等等,沉淀出了一套成熟的To B、To C 系統工程方法論,這一點尤為關鍵。
因為眼下AI原生辦公已經成為生產力基建,它不再是工具的簡單疊加,而是以用戶核心任務為軸心,徹底重構流程、釋放生產力的效率革命。
這種背景下,從單一辦公工具升級為支撐企業數字化轉型的辦公平臺,尤其是支撐國產化辦公基礎設施,扛起服務者、基建者的使命,也成為中國AI企業的重要擔當。
以商湯為代表的企業正以行動踐行這一方向。
“為積極響應國產化的需求,小浣熊已經實現了從模型到硬件的全鏈路國產化適配,后續還會陸續推出國產化的AI PC、AI box,適配更多場景。”賈安亞補充道。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。