0
| 本文作者: 任平 | 2023-08-22 09:29 |
“一款理想的醫療大模型是解決醫療不可能三角,創造生產力價值。”
近日,在雷峰網(公眾號:雷峰網)《醫健AI掘金志》對話京東健康技術產品部智能算法部負責人王國鑫,他指出,醫療絕對供給量不足是造成醫療“不可能”三角--成本、質量、可及性的根本原因。但在這一冰層下,還隱藏著醫療結構性供給不足的問題。
過去分級診療曾是解決這一問題的主要手段,通過將大量常見病、多發病、慢性病的病人,從三級醫療機構中、從專家手中,轉移到基層醫療機構的全科醫生手中。
盡管不少區域已通過醫聯體或醫共體的方式推動分級診療,但分診的重點仍在于“分”,而非“診”,被視為一種簡單的“淺層創新”。
在如今的AI大模型技術紅利下,京東健康嘗試用先進的AI技術協助醫生和患者,為創造出增量的醫療產業生產力提供一種新的解決路徑。
這就是前不久京東健康發布的面向醫療健康行業的“京醫千詢”大模型。王國鑫介紹,該大模型可快速完成在醫療健康領域各個場景的遷移和學習,從而實現產品和解決方案的全面AI化部署,為遠程醫療服務換上新的“技術底座”。
相比于業內早就推出醫療大模型的企業,京東健康的大模型發布時間并不算早。
今年5月底,醫聯率先推出首個國內醫療大模型MedGPT。6月底,叮當健康發布叮當HealthGPT,基于此研發應用型醫藥AI產品——叮當藥師、營養師AI助手。此外,潤達醫療,衛寧健康、科大訊飛、創業慧康、朗瑪信息等公司也在積極布局。
越來越多的醫療健康領域企業意識到,強大的語言理解能力、生成能力、邏輯推理能力,將讓大模型在互聯網醫療領域大有可為。
“不過,這要看哪家企業能夠率先打造出一個殺手級應用走向正循環。”王國鑫表示。
首先,相比于一些企業只選擇與三甲醫院醫生合作進行產品研發測試優化,截至7月中旬,已經有178家科研醫療機構、26家藥企、69家企業客戶,以及超過4.3萬名醫生,直接或間接參與了京醫千詢大模型的應用建設。
其次,京東健康建設了行業內首個實物與服務相聯通、知識與數據相融合的百萬級大規模健康知識圖譜,沉淀了超過億級的覆蓋線上、線下醫患場景的高質量健康檔案,并擁有海量的醫藥全域流通大數據。而這些則是打造一款“殺手級”應用的天然試驗場。
不過,大模型在互聯網醫療領域的落地仍然任重道遠。
王國鑫指出,“大模型將來要面對的幾億消費者,充當他們的健康助手。但京醫千詢目前的推理速度還有較大的提升空間。”
因此,京東健康如何運用這一創新服務模式,推動醫療服務的常態化、醫療資源的可及性,將是后續的重要命題。
以下為《醫健AI掘金志》與王國鑫的對話內容,《醫健AI掘金志》做了不改變原意的編輯與整理。
《醫健AI掘金志》:京東基于“言犀”大模型,研發了醫療大模型“京醫千詢”,這一模型上有哪些亮眼能力可以分享?
王國鑫:互聯網醫療發展歷程中,技術能力是服務的關鍵支撐,而“京醫千詢”大模型是我們醫療數智化技術的一次集中體現。
它利用了京東健康超億級的高質量醫患對話數據、大規模的醫療知識圖譜,以及公開資料如臨床實踐指南、最新的醫學文獻和專家知識等,最終涌現出三種能力:覆蓋全流程的醫療需求,具備智能決策,支持多模態的醫療信息處理。
值得關注的是,京東健康并未只將醫療大模型作為針對某一類受眾或用戶的單一產品,而是將其作為新一代醫療健康服務生態建設的“技術底座”,推動全行業解決方案和產品的智能化升級,盡可能發揮新技術的價值能量。
首先,在服務醫生方面,基于京醫千詢形成的“智能助理”工具,可以協助醫生完成診療風險識別、臨床輔助決策、影像輔助決策、患者輔助篩查、智能輔助審方等操作,幫助醫生生成語音電子病歷、進行智能隨訪,提供動態醫囑、專病管理、教學培訓等內容,從而提高工作效率,提升診療準確率。
第二,針對個人用戶,基于京醫千詢大模型的“AI健康管家”,能將用戶基礎狀態、飲食運動、生理信號等全時空健康數據,進行整合分析,提供健康方案定制、管理執行的閉環解決方案。
這不僅可以在用戶生病的時候提供幫助,還能在日常生活中提供在線咨詢、用藥指導、情感陪伴、健康自測、飲食營養管理、健康行為干預等服務。
第三,對于醫療機構和企業客戶,京醫千詢能夠協助醫療機構和企業客戶進行遠程診療服務調度、商保理賠、藥品流轉追溯、硬件服務體驗提升、企業健康管理優化等,從而幫助實現醫療資源高質量供給的提升。
第四,在科研領域,京醫千詢還可以進行輔助新藥挖掘、醫療大數據科研、標準化病歷質控、醫療專病分析、智能硬件反饋評估。
《醫健AI掘金志》:你在介紹京醫千詢大模型時用了三個詞:覆蓋全醫療流程、智能決策、多模態。單拎出來任意一個都很有挑戰,你們為何決定一次性全解決了?
王國鑫:從一開始做大模型時,我們就堅持一種想法,要先定義好大模型的能力再做技術開發。
因為京東健康中是有非常多的應用場景,而且很多場景早已廣泛使用了各類AI技術。所以與其說我們要做一個具有什么能力的大模型,還不如反過來問,我們都有哪些不得不做的能力,才能夠覆蓋京東健康已有的應用場景。
所以第一個詞“全流程”就自然產生。也就是說,無論 to C、to B、 to G、to H,其需求一定是醫療全流程“防篩診治康”中的一環,必須用最新的大模型技術替代掉原有碎片化的中小型技術。
第二個詞“智能決策”從何而來?
它確實是大模型帶來的核心想象力,在決策機制上降低對人的依賴,顯著提高用戶的收益增速度。
而且大模型之于醫生絕對不僅僅是一個問答和對話的陪伴角色,最重要的是幫助醫生完成任務,提供決策的能力。
第三個詞,多模態。
這是醫療行業的剛需。目前最常見的多模態技術是醫學影像學,如CT可以提供高分辨率的結構圖像,MRI可以提供更詳細的軟組織信息,PET可以提供代謝信息。醫生可以將這些信息綜合起來,制定更準確的治療方案。
但未來大模型必須能夠支持醫療場景下的多模態輸入和輸出,它至少得懂各種醫學資料,比如體驗報告、化驗單、以及終端可穿戴設備的監測數據,從而精準判斷病情。
總的來說,這三種能力是今天醫療大模型能良好落地的技術前提。
《醫健AI掘金志》:你們大概什么時間決定做一款醫療垂直大模型,也就是說何時開始將言犀大模型往醫療場景遷移、驗證和應用的?
王國鑫:言犀是京東的通用大模型,代表了京東最底層的技術能力。但我們并非在ChatGPT出來后才去布局,而是京東探索研究院過去幾年一直在做的工作。比如2021年,探索院就推出了“織女”模型并問鼎GLUE榜單,它可以看作言犀大模型的前身。
但我們真正決定試驗大模型的應用能力是從今年1月開始。直到今年7月,京東在JDD大會上推出言犀大模型和京醫千詢醫療大模型,并進一步建設面向產業應用的技術生態。
我覺得從技術上講是這么一個過程,所以很難回答大模型相關技術研發的起點。如果沒有之前的沉淀和積累,特別是行業人才稀缺的情況下,很難在半年之內打造一個千億級,面向產業應用的模型。
第二個問題,我們醫療場景的遷移這件事情,跟剛才的問題是一致的,并不是現在才遷移。
京東健康的技術產品體系本身就有大量的醫學自然語言工作任務,只是之前基于織女模型去開展工作,今年做了模型升級,就在言犀大模型繼續開展工作。
《醫健AI掘金志》:從通用大模型到產業大模型,半年時間里你們的主要工作是什么?
王國鑫:時間都去哪了,這是大家是非常關心的問題。首先可以明確一點,決定走大模型路線后,我們反而在技術路線的選擇上少了很多糾結。
比如說,自然語言行業有兩個核心,一個是自然語言理解,一個是自然語言生成。但是“理解”是可以用“生成”的技術去實現,所以以前我們在選擇技術路線時,會考慮兩種技術路線怎么選擇。
但ChatGPT的出現對我們最大的啟發是“技術路線的再確定”。因為不論“理解”面臨多少困難,或者“生成”面臨多少困難,都要用大模型技術去做,這一共識是ChatGPT給予我們最大的幫助。
明確路線后,我們也遇到了大模型會帶來的必然問題--幻覺。
所謂“幻覺”,指的是人工智能模型生成的內容,不是基于任何現實世界的數據,而是大模型自己想象的產物。
從技術原理來看,這些虛假信息語言模型是無意識的模仿者,并不理解自身在說什么,但是,以ChatGPT等為代表的大語言模型的“幻覺”,不僅會讓人類在海量信息中難分真假,還會對患者的生命安全、醫生工作帶來威脅。
所以從今年1月到6月,我們跟言犀模型團隊在一起,回答的一個核心問題是:如何在“有用”和“安全”兩者中做好平衡。
實際上,醫療場景的特殊性就在于對有用和安全的追求都達到了最高水平。
如果一味追求安全,大模型可以說“您這個問題我沒有辦法回答,需要咨詢你的醫生。”
反之一味追求有用,大模型就要提供相對全面的信息。而對于生成模型來說,提供越全面的信息,就意味著它出錯的概率越高。就像上臺演講,演講的時間越長,說話打磕巴的概率就越高。因此,我們提出了一種對抗AI“幻覺”的新策略。
另外,我們較早的時候就意識到言犀是一個大語言模型,但要應用在醫療場景中需要明確:大模型自身的能力邊界、何種條件下需要借助外部的業務系統、哪些場景無需大模型發揮作用及部分作用。
比如,醫生希望大模型分析一下當天所有問診情況,這種情況就需要訪問外部業務系統,即用Agent技術來實現大模型對各種工具的串聯和調度。
《醫健AI掘金志》:為了打造京醫千詢大模型,團隊內部做了哪些分工?
王國鑫:首先,算法團隊毋庸諱言,團隊中凡是有自然語言技術背景的同事基本都全員參與;其次,具有醫療背景的同事,也是最核心的團隊成員之一。
因為生成模型有一個難點:對于相對復雜的問題、超過個人認知和學識的問題,我們往往無法判斷正誤。
這個問題可以類比于,我們做了一個小語言比如阿拉伯語的翻譯模型,絕大部分人對翻譯的好壞是無法評價的,必須要懂這個語種的人才行。
因此,我們根據京東健康的核心服務場景--互聯網醫院、零售藥房、京東家醫服務,把醫療團隊劃分為三種角色:醫生、藥師、健康管理師。而且我們在醫療專業團隊建設上的投入,并不比算法團隊少。
與此同時,我們還吸引了一批專業人員。他們主要是評估大模型專業能力之外的“能力”,比如模型是否能第一時間給出內容、是否符合用戶需求,或是否能夠易于理解等。
《醫健AI掘金志》:立項、遷移、驗證、應用、到開放生態,過程中最有挑戰的是哪一部分?
王國鑫:都很有挑戰,如果非要選一個話,我認為“驗證”最難。
舉個例子,當大模型的安全性下降,幻覺提升,我們就要和醫學專家一起去“診斷”,是否模型之前使用的數據出現問題、還是迭代策略失誤,還是存在其他問題?
實際上,我們團隊里有很多PhD,還有MD,不少人還具有醫學和算法的雙重背景。即便在這種情況下,我們在做醫療大模型時仍會感覺交叉人才的缺乏。而且大模型每次迭代,醫學專家有他們的意見,算法專家也有他們的意見,還會彼此產生質疑。這些復雜評測和驗證過程需要大量細致的分析,因此占用了大量時間和資源。
我不敢說“驗證”是所有垂直行業都存在的難題,但至少在醫療行業是一個挺難逾越的鴻溝。這其實并不稀奇,例如醫學影像AI公司最難的環節也在于確立核心數據的金標準,以及醫生與研發人員的配合。
《醫健AI掘金志》:在搭建京醫千詢的過程中,京東健康過去積累的哪些能力得到發揮?
王國鑫:相比于其他大模型的推出時間,我們推出時間不算早,但我們在落地上的進展很快。有兩個原因:
一是醫療行業本身雖然技術驗證周期長,但對新技術的探索機制非常強,使得我們在醫學場景的適配速度相對較快。
比如傳感技術、人工智能技術、機器人技術、納米技術、基因技術等,幾乎都是早期階段就在醫上嘗試,創造出新的應用場景,如醫療傳感、醫學成像、智能診斷、人機交互、遠程醫療和個性化醫療。
二是京東健康過去在醫療健康服務領域的持續投入,建立了良好的驗證場景,而且基于真實醫療場景下構建出一套知識體系,這是我們的大模型快速遷移的基礎資源。
比如過去為了全面保障患者用藥安全,我們早在幾年前就構建了藥學的知識庫,如今基于此我們能夠很快速且有效地構建不同藥品之間的作用關系,解決藥學大模型中的“幻覺”問題。此外過去建立起的處方審核能力,如今也能讓我們更好地識別問診對話中的關鍵信息。
《醫健AI掘金志》:你們為何將“遠程醫療”這個點放大,“大模型+互聯網醫療”有哪些優劣勢?
王國鑫:遠程醫療是京東健康對醫療行業結構性供給不足的一種解法。
大家都知道醫療有一個“不可能”三角,即成本、質量、可及性很難同時滿足,各國只能優先保證其中兩個,美國優先的是可及性和質量,中國優先的是可及性和成本。所以是先解決看病難、看病貴,再進一步深入到看病好,水平高。
但在基層醫療機構中醫療的“可及性”還沒被滿足,存在醫療資源絕對供給不足的問題。它很用各種技術問題去解決,而是一個社會學問題或國家政策層面的問題。
但在絕對供給不足的冰層下,還隱含著大量醫療結構性供給不足的問題。
作為一家技術公司,通過遠程醫療來解決醫療供給的結構性不足是我們的核心戰略。而且遠程醫療不是單純的醫療服務項目,而是用信息技術下沉優質醫療資源的方法,提升區域醫療水平的均等化水平,解決醫療資源總量不足、分布不均衡的難題。
其次是改善就醫質量。
很多人都有感受,遠程醫療和線下面診有一種體驗鴻溝。這對醫生來講也還是一樣的。所以我們今天希望用大模型為表的AI技術,去盡可能填補這一鴻溝,用我們自己內部有一句話叫“實現線上線下的醫療同質化”。
《醫健AI掘金志》:互聯網醫療行業長期以來都是賣藥盈利,長期以來醫療AI產品未被納入醫院診療收費項目名錄,院方不愿意付費。那么用上了大模型的“互聯網醫療”,能夠更好地商業化嗎?
王國鑫:商業化很多時候都不是問題。醫療行業雖然在每個國家都不太一樣,但終歸都是一種很特殊的行業。最終能否商業化本身要回歸到一個問題上:這項技術是否為整個醫療場景創造了價值?
如果一個患者從疾病狀態走到康復狀態,而且我們能在某一個點上證明AI的價值,那么商業化就不是問題。
醫療AI產品在過去很長一段時間基本是兩種商業路徑:
一種是成為醫生或醫院的生產力工具,它的付費方就從患者“轉移”到了醫院或者醫生本身,進入醫院的收費名錄。即院方付費,但很多醫院在實際購買時動力不足。
第二種是診療效果被醫生和患者認可,最終由患者付費。這是過去很長一段時間數字療法等技術不斷追求的目標。
而我們今天談的大模型技術,有可能會帶來新的商業模式。
比如大模型支持下的健康管理解決方案,實際上是要打通院內院外,用戶離開醫院還能持續獲得醫療服務。那未來或許會看到,以大模型技術為代表的AI技術產品能突破原有的商業思路,帶來新的商業路徑。
《醫健AI掘金志》:在醫療大模型的路上,華為的算力基礎設施、以及終端硬件,廣受業界青睞。你們為何選擇華為的硬件,將來還有哪些合作?下一階段,京東健康還有哪些規劃和升級?
王國鑫:站在我的角度去講,京東健康和華為的合作是兩方面的。
一個是同華為等公司合作構建國內的底層技術生態。這件事情可以認為我們這一代技術人的使命,因為我們都不太希望國際上存在技術斷鏈的情況,也期待實現全球價值自由的流動。
另一方面,我們會和華為的產品結合。華為有較好的硬件生態,消費電子產品在國內有舉足輕重的地位,京東健康則是一個有醫療健康全場景的服務商,我們兩者的合作能夠為消費者提供長周期的健康管理能力,這件事情本身在業務合作上很順暢。
京醫千詢大模型下一步的核心工作是驗證它在部分場景上的安全性、提高推理速度、降低資源消耗。
安全不用多說。做大模型的團隊都知道,最后拼的一定是推理速度和成本。如果將來想完完全全面對幾億消費者,提供健康助手的能力,以我們現在的推理速度和成本還有較大的提升空間。
同時也要快速優化我們的底層技術,資源消耗進一步降低,為下一階段全面開放使用做準備。
《醫健AI掘金志》:大模型可能應用場景覆蓋診前、診中、診后多個環節,但臨床設想距離落地仍有一定差距。所以醫療領域的大模型之爭,將按照什么邏輯演化?
王國鑫:我個人觀點,今天醫療領域的大模型在比拼,最后拼的是誰能更快走向正循環。
什么叫做正循環?正循環的核心起點是有一個殺手級別的應用(killer app) ,你要在這個killer APP上不斷創造價值。反過來用戶還能夠打磨你的技術,增強killer app 。這是整個產業生態,也是這一代AI技術所不得不面臨的核心問題。
走向正循環有五個前提:一,基座競爭,這是一個永恒話題,大家都把它比作“殺手锏”;二,高質量數據的競爭;三,驗證能力的競爭;四,推理能力的競爭;五,AI Native的“殺手型”應用。這種產品洞察能力是整個市場所期待的,也是我們實際工作中需要進一步加強的。
雷峰網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。