0
癌癥早篩,普遍被認為是一個潛在的千億級產業。
但胰腺癌,卻是例外。
從商業角度看,這是一個長期“被否定”的選項。因為比起肺癌、結直腸癌、胃癌、肝癌等,胰腺癌并不屬于高發性癌種,但擅長偽裝、先天耐藥、手術切除率只有兩到三成。最致命、最難發現、擴散最快,“癌王”,成了胰腺癌的公認的代號。
要蹚胰腺癌這條路子,基本上可以預判:錢少事難,要么情懷,要么詐騙。
這也正是矛盾所在。在臨床醫生看來,胰腺癌作為癌王是“悲哀”的。無論是國內還是國外的臨床指南,都不推薦胰腺腫瘤篩查,因為迄今為止,沒有一種方法適合所有人,而且保證篩查結果可靠。
因此,超過80%確診患者,一經發現即晚期,存活率在1年左右。但是根據美國約翰霍普金斯醫院最近發表的重要臨床工作,早期或者偶然發現的胰腺癌患者的生存率可以很高,比如9.8年。
胰腺癌是一次有組織的、秘密的人類攻擊,從癌前病變進展到癌癥1期2期可能10年,但是越到最后是突然間指數級增長。也就是說,上帝并沒有宣判死刑,但幾乎沒有人會逃過詛咒。
五年前,一項最有望扭轉這一困境的技術,CancerSEEK(基于ctDNA的檢測方法),由全球癌癥遺傳學大牛Bert Vogelstein教授和團隊提出,成果發表于Science期刊,曾一度解決了包含胰腺癌在內的多癌篩查問題,覆蓋了大部分致命癌癥,引發全美投資熱潮以十億美元計數。
時至今日,這一技術離轉化為產品還遙遙無期,致命弱點就在于這一技術并不通用。
如果這場聲勢浩大且令人耳目一新的技術讓人有過短暫的著迷,那么它真正的價值在于激起人類的挑戰欲望。
阿里達摩院便是其中之一。
面對多癌篩查這一宏大且迷人的命題,達摩院毅然選擇了另一條看似更易、實則更難的路徑——AI。
故事的開始,源于2018年的一次不幸。
來自上海市胰腺疾病研究所的曹凱醫生,在某三甲醫院臨床輪轉的時候,其導師A教授后來不幸確診胰腺癌,發現時已是晚期,最終因醫治無效在2018年逝世。
痛惜之余,曹醫生在翻看A教授的病歷數據時發現,其在確診胰腺癌的十個月前曾在醫院體檢時拍過一次胸部平掃CT,仔細察看,胰腺部分有一絲病變痕跡。
這讓曹醫生萌生一種大膽的想法:假若所有胰腺癌患者都能在確診前的十個月甚至更早,通過體檢提前發現癌癥病灶,并進行根治性的手術切除,將獲得更好的生存質量。
Bert Vogelstein教授也持有類似的觀點,任何一個窮兇極惡的晚期腫瘤也都是從癌前病變到1期2期一步一步進化而來。
這件事的難度相當于重新開辟一塊“新大陸”。
由于平掃CT圖像的對比度極低,多用于肺炎、肺結節等日常疾病診斷,醫生也沒有在平掃CT上受過癌癥診斷的訓練經驗。而當年AlphaFold的面世,讓曹醫生意識到,通過引入人工智能的能力,是有可能識別CT上那些肉眼難以察覺的病灶信息,從而攻破胰腺癌的早篩難題,這也成為他此后的臨床科研重點。
此去經年,曹醫生一直在尋找合適的技術合作方。直至幾年前,他與達摩院接觸,發現這個研究部門很不一樣,既有充足的AI技術儲備,同時也有著豐富的臨床實踐經驗。
達摩院醫療AI團隊長期注重以技術解決臨床的真實需求,與一線醫生保持緊密的科研聯動,了解到曹醫生的科研方向與其導師的故事,也敏銳注意到,假如AI能把最難識別的胰腺癌都搞定,這將極大推動這一領域的前進。
雙方一拍即合,隨即聯同全球10多家頂尖機構發起研究課題,正式向“平掃CT+AI”的大規模胰腺癌早期篩查發起挑戰。
其中包括:上海市胰腺疾病研究所、浙江大學醫學院附屬第一醫院、中國醫科大學附屬盛京醫院、復旦大學附屬腫瘤醫院、上海交通大學醫學院附屬新華醫院、約翰霍普金斯大學、布拉格查理大學第一附屬醫院、哈佛大學等。
這顯然是一支堪稱豪華的研究團隊。這種陣容的組合搭配,或許才是人類與“癌癥之王”在這場曠日持久的斗爭中勝出的底氣所在。
11月21日,Nature Medicine正式刊發這項研究成果,一個名為“PANDA”(PAncreatic cancer Detection with AI)的胰腺癌早篩模型正式亮相。
PANDA的發布意義在于,證實了在平掃CT上使用AI進行胰腺癌篩查的可行性、而且是中國放射影像領域的科研成果首次刊登Nature Medicine。

論文題目:基于非增強CT和深度學習的大規模胰腺癌檢測
達摩院是怎么做胰腺癌早篩的?普通人什么時候能用上?以及一個直擊靈魂的拷問:這真的不是企業AI研究院做著玩?
論文成果一出,圍繞著AI能否用于胰腺癌篩查的爭論也剛剛開始。
近日雷峰網(公眾號:雷峰網)對話達摩院醫療AI團隊負責人、IEEE Fellow呂樂,他回復到:Nature Medicine在審稿時也是這樣的疑問。首先要看你的training code,然后還要三位資深審稿人獨立審稿,其中有一位美國醫生在審稿里面問了我們58個問題,說明他這個大臨床專科醫生(從他提出的的問題的專業性,廣度和深入程度上看,肯定是胰腺癌這方面的大專家)多多少少是有點不太相信的。
“因為我們的最大創新之處在于,首次證實了在平掃CT上使用AI進行胰腺癌篩查的可行性,并達到了之前認為可能達不到的高性能。”
直白點說,要把“大規模胰腺癌早篩”這個問題拆解開,最終會發現,這不僅是個技術問題,也是一個是經濟問題。
對于任何一個關乎臨床的服務,大規模臨床數據是技術的最有力背書,再進一步轉化為產品,則需要配合現有醫療條件降低落地成本。
有著臨床醫學背景,曾在美國愛荷華大學和國立衛生研究院(NIH)臨床中心從事疾病和人工智能研究的張靈,是達摩院本次胰腺癌早篩工作的項目負責人。
他補充到:“在我們之前,大家不知道平掃CT可以用來檢查癌癥。過去對腫瘤的檢測和診斷,主要使用增強CT,需要給病人注射或者口服造影劑,并不適合大規模篩查使用。”
相比較而言,平掃CT普遍被百姓所接受,在體檢和門診等場景中更為常見,不增加額外費用、檢查、輻射等。因此,“讓AI配合影像,而非影像配合AI”,成為達摩院最先確立的準則。

呂樂、張靈
在實際應用中,敏感性(即不易漏診)和特異性(即不易誤診)是評價醫學影像類AI篩查工具的兩大標準,但往往需要在一定程度上進行權衡。提高敏感性可能會增加誤診的風險,而提高特異性可能會增加漏診的風險。
這里分享一組真實的數據和案例:
在歷時一年多的開發與驗證中,通過對在20530名真實世界連續病例的多場景驗證,達摩院訓練的這款胰腺癌早篩工具達到了92.9%的敏感性、99.9%的特異性,發現了31例臨床漏診病變,有2例早期胰腺癌病患已完成手術治愈。
其中1例是患者每年都會定期去某三甲醫院體檢中心進行體檢,并安排胸部CT檢查,在今年的體檢并沒有發現任何異常。在其體檢后的第7個月,該患者的CT圖像數據被納入到該研究的回顧性臨床驗證,被檢出“有95%概率患有胰腺神經內分泌腫瘤(PNET)”。
在經過多學科會診后,院方決定召回患者進行磁共振增強檢查并成功手術,后續結合術后病理報告,這名患者最終確認為屬于早期PNET(G1級別,1.5cm)。接下來半年的隨訪顯示,這位患者的腫瘤并沒有復發或轉移。
這是實實在在的早發現、早治療的臨床案例。呂樂表示,“癌癥如果治療得當,在指數生長之前抓住它,這個人就有治了,就是會很好治。在美國,一半的醫療費用是患者死前的三個禮拜花掉的。”
這項研究已在阿里云上開放API調用接口,以便醫生體驗和使用。目前已在醫院、體檢等場景被調用超過50萬次,本地化部署的模型每次檢測耗時約40秒,每檢測1000次只出現一次假陽性,隨著迭代未來還有提升空間。
針對這次的研究成果,Nature Medicine罕見地刊發評論文章,稱“基于醫療影像AI的癌癥篩查即將進入黃金時代”。
論文共同一作、上海市胰腺疾病研究所的曹凱醫生認為,“PANDA將拓寬業內對胰腺癌篩查的認知邊界,推動臨床治療的發展。”
另一位共同一作、復旦大學附屬腫瘤醫院放射診斷科的湯偉醫生表示,“PANDA提出了一種有潛力的大規模胰腺癌篩查方法,在提升檢出率的同時,又不會給病人帶來額外的輻射與經濟負擔。”
上述觀點,反映了當下臨床醫學的一大趨勢:在醫療數據與人工智能的交織碰撞下,醫生面對各種疾病時的治療思路和就診流程都會發生直接變化。
張靈提到,醫生是否愿意使用一個AI工具,評價標準非常直觀:臨床價值、產品力。
前者是指,這個AI產品真正創造了不可或缺的臨床價值,給病人解決了性命攸關的生存問題。所以“做什么”是非常關鍵的;
后者是指,好用、易用,比如一個醫學影像的AI工具需要同時保證特異性、敏感性、精度等,還要與臨床流程打通集成,無需切換工作流。所以“怎么做”也非常關鍵的。
這一觀點也得到了呂樂的認同,他舉了一個用“普通X光+AI”來檢測骨質疏松的例子。
通常來說,骨質疏松的診斷需要借助“雙能X光”進行骨密度檢測。理想狀況下,中國每百萬人得配12個雙能X光機,但是現在中國每百萬人僅有0.2個。這時候用“普通X光+AI診斷”,反而是一種更具普及性的選項。
“好的X光圖像通常具有3000*4000的分辨率和12位色深,但現在電腦屏幕的分辨率通常是1920x1080和8位色深,這為醫生帶來了細節上的困擾,需要調整參數以獲得準確診斷。”
相比之下,AI的優點在于,能夠更準確地處理和分析圖像中的像素,而且并不需要額外的成本,因為病人的數據已經在醫院的數據庫中。AI可以快速處理數據,找到那些需要特定接受進一步骨質疏松篩查的病人。
進一步來說,臨床無小事,評估一款醫療AI產品的好壞,不能過于追求技術上的所謂先進性,因為很多時候“高級”和“好用”并不等價。
就拿骨質疏松的模型來說,很多內分泌科醫生對AI的理解很深,相信AI來檢測骨密度會做得很好,所以寄希望于AI在這個子任務(Narrow Task)上取得超人的效果,而不是像LLM那樣可以做許多其他任務的“通用模型”。
作為真正的AI用戶--醫生感知很重要,直接決定了醫院愿不愿意為工具付費。因為絕大多數醫生不會關心企業采用的究竟是什么模型和算法,他們只關注你最終交付的是什么樣的成品。
回到本次胰腺癌的主題上,顯然單純的公開數據集無法訓練出一款好用的AI模型,前提還得是真實的患者數據、專業醫生數據標注、以及到醫院場景里親自跑上幾遍。
張靈介紹了PANDA模型的訓練策略,著重指出三點:
1、依托多家合作的三甲醫院,我們構建了迄今最大的胰腺腫瘤CT多中心數據集,其中訓練集3000例,但這樣的規模對深度學習不算大,設計怎樣的算法能最大化精度且保證良好的泛化性?我們嘗試過目標檢測、語義分割、圖像分類、影像組學結合機器學習、聯合分割分類等技術路線,最終是級聯的聯合深度分割分類模型最佳。
2、訓練AI篩查模型需要醫生手工標注大量腫瘤,而平掃CT圖像對比度極低,醫生幾乎無法標注,我們請醫生先在增強CT上勾畫,創新性地采用適用于腹部CT圖像配準的算法,把增強CT上的勾畫遷移到平掃CT上,并以病理金標準確認的腫瘤類型為標簽監督模型的學習,從而使PANDA能突破人類醫生在平掃CT上檢測診斷胰腺癌的天花板。
3、為驗證PANDA的臨床表現,我們將模型部署至合作醫院的IT基礎設施與工作流中,進行了2輪大規模的在真實世界多場景(體檢、門診、急診、住院)連續病人群體的回顧性臨床試驗。最終達成99.9%特異性,即每1000例測試出現1次假陽性。換句話說,這千分之一的“不完美”就交給醫生了。
實踐證明,在PANDA檢測出胰腺癌的病人中,56%-74%的病人是真胰腺癌,其余的是醫生比較容易排除掉的病變(脂肪浸潤,胃腸內容物等)。

達摩院工程師進入合作醫院,實地調試部署PANDA
可以看出,與過往的醫療影像AI工具相比,達摩院在打造這款胰腺癌早篩的專用工具時,“數據價值”被不斷放大。
呂樂表達了一個觀點:為什么OpenAI很強大,發揮出LLM的智慧,因為模型性能最終取決于數據的質量和數量。如果數據比OpenAI的差得很遠,一定很難在性能上超越它,因為所有模型本質是一個統計模型。有時候算法改進帶來的性能提升,遠比不上高質量數據帶來的效果更明顯。
隨后他開玩笑地提到,這或許可以概括為“data curation AI”。尤其是醫學領域,大家應該踏踏實實地與臨床工作相結合,認識到這是未來發展的趨勢。
一個強大、好用且貼合臨床實際需求的AI工具,正逐步成型。
呂樂表示,“這次胰腺癌的成果只是達摩院醫療AI多癌篩查的眾多研究之一,下一步是推動實現‘8+5’平掃CT一掃多查,覆蓋13種致命癌癥、慢性病,最終目標是用一個平掃CT檢查,通過AI就能夠幫病人解決多種疾病的智能篩查、輔助診斷與定量分析。”
“為什么這件事一定是達摩院來做?”
達摩院本身的定位不是事業部,也不是傳統的AI中臺,它既擺脫了這兩種類型的俗套,又借鑒了它們,因此成為一種奇特的存在,以解決社會問題為導向。
“21世紀的公司,只有解決社會問題才能活下來,不解決問題活不下來的。”2017年達摩院成立初期,馬云稱。
達摩院重點投入AI for Science,布局醫療、農業、電力等領域,聚焦中長期的科學技術研究以解決社會問題。2020年新冠疫情初期,達摩院緊急研發出“CT影像新冠肺炎AI輔助診斷系統”,曾讓阿里達摩院醫療AI團隊一戰成名,被科技部評為科技抗疫先進集體。
多年下來,達摩院積累了豐富的計算機視覺、深度學習等AI技術,并與醫學界、工業界保持緊密合作,將大量前沿技術轉化用于臨床實踐。
總體來說,達摩院都是用“AI來解決那些尚未得到解決、而病人又真切需要的臨床需求。”2021年8月起,呂樂擔任阿里達摩院醫療AI團隊負責人,便定下這條醫療技術第一性原則。
在加入達摩院之前,呂樂已是業界富有盛名的醫學影像科學家;加入達摩院后,基于醫學影像的癌癥篩查和研究進展頻出。
2022年10月,達摩院初步驗證AI與平掃CT結合的技術可行,有望在體檢中查早期食管癌,敏感性特異性超過專家醫生水平,相關論文發表在MICCAI 2022。同月,基于深度學習對頭頸癌癥42個危及器官進行高效精準自動勾劃,可有效減少放射治療的并發癥,相關論文登上國際醫學期刊Nature Communications。
2023年6月,聚焦于視覺領域著名的OOD(分布外檢測)難題,提出了全新的醫學圖像語義分割框架,能夠讓AI更準確地識別腫瘤中的疑難罕見案例,目前已在胰腺腫瘤和肝臟腫瘤上獲得驗證,被計算機視覺國際頂會CVPR 2023評為Highlight論文。同月,基于增強CT的胰腺腫瘤鑒別診斷,發表在醫學圖像處理頂會IPMI 2023。
2023年8月,發布多癌影像分析通用模型CancerUniT,借助增強CT,可輔助診斷八種主流癌癥,該模型的論文成果已被計算機視覺頂會ICCV 2023收錄。同月,發布第一個可以分割全身143個器官的連續深度學習框架,該模型的論文成果已被計算機視覺頂會ICCV2023接受。
不久后,達摩院免費開放100件AI專利許可,其中有3件是專門針對癌癥的精準治療,和解決關鍵的醫療圖像配準問題(后來在10月份MICCAI 2023 Learn2Reg競賽上,達摩院相關醫療圖像配準技術以比較明顯的優勢,獲得所有兩個賽道的冠軍)。
2023年10月,基于CT圖像的肝臟腫瘤篩查與診斷、胃癌篩查、肺結節自動檢測及良惡性鑒別、胰腺癌預后等幾項工作也在MICCAI 2023發表。
2023年11月,達摩院聯合全球10多家頂尖研究機構首次提出以“平掃CT+AI”進行大規模的胰腺癌早期篩查,發布胰腺癌早期檢測模型PANDA,相關論文成果登上了國際醫學頂刊Nature Medicine。
這些標志性成果將達摩院醫療AI與精準醫療緊密聯系在一起,也是AI for Science的生動范例。
在呂樂的設想中,未來AI不僅可以輔助醫生進行肺結節、癌癥等臟器疾病篩查,同時進行心臟病CVD事件十年定量風險打分,腰椎、盆骨的骨骼疾病篩查,從而實現多個檢查的同時進行。
“從脖子到骨盆的軀干位置,都可以通過平掃CT+AI輸出多個篩查報告,醫生結合專業判斷再給出最終的診斷總結。”
呂樂表示,云端部署將是醫療AI最好的服務形態,所見即所得,省去很多繁瑣的步驟,模型能夠實現快速的迭代、部署和應用,為更多病人提供幫助。
“我們不少模型已在阿里云上開放API調用接口,以便我們的合作伙伴,醫生與醫療機構使用,最近每天為大概8萬人次的病人提供智能化醫療服務。”
透過醫療AI,達摩院找到了前沿技術跟社會問題完美契合的平衡。至于要回應馬云“它要活得比阿里更久”的期許,達摩院顯然已經走上了正軌。
本文作者吳彤長期關注醫療科技領域,歡迎添加微信互通有無:icedaguniang。
雷峰網
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。