0
在清華建校110周年慶祝大會上,北京大學校長郝平首次宣布,在人工智能教學和科研上,雙方將聯手建立通用AI實驗班。
這意味著,這兩家互為榜樣,互相調侃多年的對門鄰居,在人工智能上首次選擇了并肩站隊。
而事實上,在多年時間里,兩所高校內部的姚班、圖靈班已經先后培養和孵化出眾多AI界的頂尖人才和創新企業。
僅以北大為例,先后走出了百度CEO李彥宏、前360首席科學家顏水成、微眾銀行首席人工智能官楊強等一眾頂尖大佬。
在人工智能領域也是領頭的北大,2002年成立了智能科學系,該系也是北大在人工智能領域最主要的機構,主要從事智能感知、機器學習、數據智能分析等方向的基礎和應用基礎研究,側重于理論、方法以及重大領域應用上。
其曾參加多項國家級重大科研課題和橫向應用研究項目,如國家重大科技攻關課題、國家重點基礎研究發展規劃(973)課題、863重大科研課題等30多項科研項目;先后獲得重要科技獎勵20多項:
其中指紋自動識別技術先后獲得國家科技進步二等獎和教育部科技進步一等獎,以該項成果為基礎建立了國內最大的指紋技術產業;人工神經網絡說話人識別新方法的研究獲得教育部科技進步一等獎;國家空間信息基礎設施關鍵技術研究獲得2000年中國高校科學技術二等獎,入選2000年中國高校十大科技進展等。
此外,北大又宣布成立了人工智能研究院。研究方向包括人工智能數理基礎和認知科學基礎、智能感知、機器學習、類腦計算、人工智能治理以及智能醫療、智能社會等方面。
而在最近爆火的AI制藥賽道,也有一家由北大系創立的AI企業,正在逐漸嶄露頭角。
2021年5月,英飛智藥宣布完成由麗珠制藥和同創偉業領投的Pre-A 輪融資,此外在新藥研發中充分利用并持續發展先進的AI藥物發現技術,打造了自主知識產權的AI+新藥研發平臺——智藥大腦TM。智藥大腦是集頂級專家人才、一流AI+新藥研發平臺、前沿藥物設計方法一體的藥物發現系統。
在這家企業的背后,其創始人裴劍鋒博士便是北大前沿交叉學科研究院定量生物學中心的研究員,此外,其聯合創始人徐優俊和張偉林也分別是北大前沿交叉學科研究院定量生物學中心的博士和整合生命科學博士。
近日,雷鋒網《醫健AI掘金志》以“AI制藥·下一個現象級賽道”為題,邀請華為云、西湖歐米、英飛智藥、宇道生物、燧坤智能五家AI制藥新秀,舉辦了一場線上云峰會。
作為此次活動的演講嘉賓,英飛智藥首席科學家張偉林,以《人工智能與新藥研發》為題,對英飛智藥的管線布局,以及AI平臺做了介紹。
張偉林表示,最近幾年,生命科學的一些原創性研究正在加速積累,包括靶標機制、新靶標結構以及檢測和表征方法,都取得了突飛猛進的進展;而下游產業端也在愈發成熟,例如CRO,就將許多任務做得非常優秀。
但醫藥行業目前還存在一個關鍵性問題,就是“新分子發現與轉化效率不足”,也就是當新靶標還處于早期階段的時候,很少有人真的敢去提前進行布局。
這也導致我們原創藥和醫藥產業整體處于落后地位。一個藥物在臨床之前,因為化合物結構已經確定,適應癥也已經確定,所以藥物發現過程,很大程度決定一個藥物能否上市,能否創造價值,可以看做是整個行業最重要的命脈之一。
藥物設計最重要就是要找到未被滿足的臨床需求。所謂臨床需求,更多是要從患者角度來考慮,做出來的藥物才能更有市場,我們目標具體定量來說,就是縮短研發周期,提高研發成功率。
對于分子對接來說,首先需要準備靶蛋白結構。當然生物體也有一個特質,就是同樣功能可能會有同樣折疊方式,當沒有蛋白結構時候,也可以通過同源模建把結構模建出來(alphafold 2可以作到比較準確的從頭預測)。
接下來是結合位點確認。在有的項目中,已經有復合物結構,也就明確了小分子結合位置,可以設計一個更好結構。
而有的時候,對于全新蛋白結構,其實并不知道配體是什么,這時就可以運行位點探測程序,例如CavityPlus程序,在表面進行探索。
接下來才是小分子對接,對接之后再對對接構象進行打分評價,進行體外細胞動物實驗。
在這里我對計算機輔助藥物設計,也就是傳統CADD和AIDD簡單進行一下比較。
CADD主要特點就是每一個工具和流程目標比較明確,而且通量整體也比較高,底層有物理化學規則支持。
人工智能輔助計算(AIDD)就需要定義一個目標,這個模型或者一套流程究竟要干什么,這需要好好規劃,不然就會出現定義目標對選擇框架太難的情況,最后導致罷工。
當然AIDD最好特點就是超高通量,我們也曾經做過超高通量實驗,以分子對接數據為基礎訓練機器體系模型,發現這個模型速度能提高一百到二百倍,七八億量級數據庫,大約半天就能完成初步篩選。
以下是演講全部內容,雷鋒網做了不改變原意的整理和編輯:
首先感謝雷鋒網給我們提供一個和各位線上朋友進行交流的機會。
首先介紹一下我自己,我本科專業是北京大學化學系,主要做的是物理化學;幾年之后,又在北京大學前沿交叉學科研究院完成博士學位,在北京大學化學系做博士后。
2019年,我和幾位創始人一起參與創立了英飛智藥。

英飛智藥擁有國內非常領先的AI+CADD的開發團隊,之前做CADD已經有大概20多年技術積累。我們的團隊是由AI驅動,CADD作為支持輔助,一直在為新品種努力,主要是目前針對未滿足的臨床需求,努力發展靶標發現以及藥物發現的新方法。
我們主要就是開發自主創新的藥品管線,爭取獲得一個原始創新藥物,當然我們也會為很多醫藥企業和研發機構提供先進的AI新藥研發技術服務和解決方案。
因為做創新藥是一個非常復雜的過程,所以在這個過程中要非常深入和謹慎的思考一些事情,只有這樣創新藥物才能有可能做出來。
我們公司目前已經完成Pre-A輪融資,內部平臺——智藥大腦也已經上線,它包括了30多個藥物設計的方法模塊,以及實用藥物設計流程。
同時公司已經開展自研創新候選藥研發5項,4項已經完成設計工作,IIP-001A項目獲得與上市藥物可比的體外生物活性,IIP-003A項目的第一輪化合物體外活性數據,接近或超過陽參活性數據,我們還與多家機構進行早期創新藥物研發合作。

今天晚上的報告大致包括以下內容:
第一部分,新藥研發的相關背景;
第二部分,介紹人工智能應用于早期藥物研發的方面;
第三部分,對人工智能如何推進新藥研發做展望;
首先有一個問題,我們在一個什么樣的時代?

其實我們目前處于一個Deep Learning的時代,當它第一次出現的時候,大家還都會比較迷惑。
自從上世紀1950年提出人工智能這個概念之后,這個概念就一直往前發展,在1980年到2010年這段時間,就變成了機器學習,并且在這個時期提出的許多比較先進的機器學習算法,一直到現在還在使用。
而Deep Learning進入人們的視野是在2010年之后,因為隨著計算技術提高,我們有能力做更大規模計算,同時我們也有更多的數據。
在更多數據面前很多以前learning算法的速度達到上限,而Deep Learning因為技術本身的優勢,還能夠繼續往上提高速度,我們目前就處于這個狀態。
接下來我們來認真地想一想究竟什么是learning?
對于學習,我們可以很簡單認為,學習就是學會在接受刺激的時候該如何正確地產生響應。

例如開車過程,我們在開車的時候,會收到外界刺激信號,通過眼睛、耳朵以及身體去感受這些刺激信號,通過神經系統進行輸出,最后用手和腳進行響應。
再比如自動駕駛技術,實際上是利用技術,利用不同感受器、攝像頭、雷達以及定位等,讓車子知道自己在哪兒,以及所處的環境,進而用機械來響應。
接下來看機器學習,目前主流機器學習有三種分類:
第一種有監督學習,就是對一個數據進行連續數據映射和分類。
在這種情況下,我們獲得的數據一般都是有標簽的數據,實際就相當于我們考試題有標準答案一樣,需要建立這樣一個映射,能夠映射數據標簽。
第二種無監督學習。無監督學習在機器學習的時代比較有兩個比較著名的概念——聚類和降維。
目前Deep Learning比較火熱就是生成模型,實際在無監督學習中,我們的數據是一些無標簽數據,需要運用一些概率統計算法,然后對這些數據底層固有結構進行學習,然后基于這樣固有結構,進行人為價值觀判斷。
第三種強化學習。強化學習最重要的是與環境交互而獲得獎勵,比如說下棋,通過與人或其他機器進行對弈,然后獲得獎勵,獎勵的標準可以就是這盤棋下贏了。
這里很重要的一點就是與環境交互數據,學習如何采取合理行動來最大化獎勵,所以在學習過程中,最重要一個問題就是要好好設定學習目標到底是什么。
如果一個目標不切實際,或者這個目標和真實需求相差太遠,學習模型往往只是徒勞而無功。

接下來簡單說一下藥物研發背景。
藥物研發從現有研發流程來看,首先是要提出與疾病相關的靶標,再針對這些新靶標開展下一步工作,如果是小分子藥物,就進行先導發現過程,發現有潛在活性的小分子化合物,這個時候,是否能夠與靶標結合往往是最重要一點。
當把機制搞清楚之后,就可以向下一步候選化合物階段發展,一般是優化小分子性質,例如生物活性、藥代動力學性質、毒性安全性。
當化合物基本比較安全,性質也非常好之后,就可以開始往臨床進行推;經過臨床實驗后,將化合物最終推向市場。
這樣一套流程,最大特點就是研發周期長,費用也比較高,回報相對也比較高。
但在許多情況下,這樣流程還有一些不足,例如應對突發傳染性疾病,在這種情況下,如果沒有預先準備,完全按照這一套來做,就會很慢。
我們作為一個國內的公司,自然要看一看國內新藥研發的一個現狀,目前國家生物醫藥資源實際上是非常豐富的,市場也是非常廣闊的。
這幾年,上游生命科學的一些原創性研究正在加速積累,包括一些新靶標、新靶標機制、新靶標結構以及一些非常優秀的檢測方法表征方法都在很快的積累,下游工業化工作,例如CRO也日趨成熟,能夠將交代的任務做得非常好。
但目前仍有一個關鍵問題新分子發現與轉化效率不足,也就是對于新靶標,還很少有人敢去提前布局,新分子發現和轉化效率仍然還是有所欠缺。

藥物發展過程這張圖大家都見過,實際是一個漫長的流程,算上生物過程,前期就需要3-7年。
一般得到候選化合物再往下走,從臨床前實驗到臨床試驗,都需要漫長的觀察期,才能最終上市。
我們的創始人裴劍鋒也曾提到過,一個藥物在上臨床的之前,因為這個化合物結構已經確定,要治的適應癥也已經確定了,所以藥物發現的過程其實就很大程度上決定了一個藥物能否上市,所以精準的藥物設計工作是要在非常早期就進行規劃。

藥物設計最重要就是要找到未被滿足的臨床需求。所謂臨床需求,更多是要從患者角度來考慮,做出來的藥物才能更有市場,我們目標具體定量來說,就是縮短研發周期,提高研發成功率。
藥物設計有以下的一些主要方向:
第一,要找到創新靶標與創新藥物,實際上這是一種對疾病的理解;
第二,作用機理要明確,如果作用機理不明確,很有可能藥上了市后,出現意想不到的副作用;
第三,就是獲取苗頭化合物和先導化合物;
第四,優化先導化合物,這是目前大家都能看到的。
我們的智藥大腦,實際是需要結合專家經驗與先進人工智能、CADD技術以及各種藥物信息技術,來幫助新靶標發現以及藥物發現,來最終驅動原始藥物。
在這個過程中,要嚴守物理化學科學規則,并發揮想象力才能更快成功。

下面來介紹一個常見的例子,即基于受體結構的藥物設計。
這里需要提一下鎖鑰模型概念:鎖鑰模型就是小分子化合物結合到蛋白表面的一個口袋,它們是一種互補的關系,可以通過晶體結構來獲得一個復合物。
這個過程中,我們會抽象出一系列重要相互作用,再依據這些相互作用尋找新分子。這些重要相互作用表征得更好,那么設計效果也就越好。

對于分子對接來說,首先需要準備靶蛋白結構。當然生物體也有一個特質,就是同樣功能可能會有同樣折疊方式,當沒有蛋白結構時候,也可以通過同源模建把結構模建出來(alphafold 2可以作到比較準確的從頭預測)。
接下來是結合位點確認。在有的項目中,已經有復合物結構,也就明確了小分子結合位置,可以設計一個更好結構。
而有的時候,對于全新蛋白結構,其實并不知道配體是什么,這時就可以運行位點探測程序,例如CavityPlus程序,在表面進行探索。
接下來才是小分子對接,對接之后再對對接構象進行打分評價,進行體外細胞動物實驗。
在這里我對計算機輔助藥物設計,也就是傳統CADD和AIDD簡單進行一下比較。
CADD主要特點就是每一個工具和流程目標比較明確,而且通量整體也比較高,底層有物理化學規則支持。
人工智能輔助計算(AIDD)就需要定義一個目標,這個模型或者一套流程究竟要干什么,這需要好好規劃,不然就會出現定義目標對選擇框架太難的情況,最后導致罷工。
當然AIDD最好特點就是超高通量,我們也曾經做過超高通量實驗,以分子對接數據為基礎訓練機器體系模型,發現這個模型速度能提高一百到二百倍,七八億量級數據庫,大約半天就能完成初步篩選。
AI模型能夠涵蓋很多其他因素,而這些涵蓋的這么多其他因素,如果直接編程,代碼量會非常恐怖。所以,現階段CADD和AIDD基本一起使用,才能夠帶來更好效果。
接下來介紹一個比較工具,這是多維度配體的虛擬篩選。
我們把這部分放在先導優化步驟,其實本身也是有爭議的,因為它應該是介于發現與優化之間的這么一個工具,我們就先簡單把它歸在先導優化這里來。
簡單說一下基于配體的虛擬技術。
基于配體的虛擬篩選技術和我剛才講的基于受體結構不太一樣,這里實際上有一個假設:就是相似配體可以結合在相似口袋當中,也就是有可能鑰匙不是原配鑰匙,但也能開這把鎖。
基于配體虛擬篩選技術的一個核心概念就是:相似分子需要相似性質,這涉及分子表征問題,即如何說明兩個分子很像。
目前主流技術上會做分子描述符、二維分子表征和三維分子表征,核心就是度量問題。
分子描述符分為定量和定性兩方面描述一個分子。
其中有很多性質可以來描述兩個分子是否相同:例如最基礎可以通過實驗表征,比如光譜數據比較像不像,然后從結構式上就能看出氫鍵供體數目,物理化學性質。

對于二維分子表征,二維分子指紋是其關鍵特征,大概有幾種類型:
第一,按照路徑把它看成一個圖,就像一筆畫一樣從一個點到另一個點,走怎樣路徑;
第二,就像剝洋蔥一樣,以一個點為中心在它周圍畫圈,再使用哈希方式對它進行指紋化處理;
第三,用一些方式直接找其中關鍵結構;
第四,藥效團,它實際上更多的是把分子性質作為一個散列化處理。
除了二維指紋之外,目前也有人去設計三維分子指紋,三維分子指紋相比二維來說就會復雜一些。因為分子三維構象還比較多變,所以三維指紋目前用的還不如二維指紋多。

總結來說,AI多維度配體虛擬篩選,其實還有很多應用場景。
例如細胞實驗,它可能比分子實驗或生化實驗更早建立體系,可以進行高通量篩選獲得活性小分子,這可能并沒有確定靶標或只有假設靶標,對于比較感興趣的小分子,會進一步在大庫里搜索。
這個時候如果用對接搜索,計算量會非常大,所以直接用基于配體搜索,就像我們用搜索引擎一樣把它變成字符串搜索,就能很快得到相關度最高分子。

這是我們和合作者在去年發表的一篇綜述,里面對一些分子指紋和基于配體的虛擬篩選提供一些總結,大家可以參考一下。

這是在我們平臺上做的實現,我簡單介紹一下流程。
這是非常常見的場景,例如我們在讀文獻的時候,發現一個化合物很不錯,這時就可以通過截圖方式把它用AI方式直接識別成一個計算機可讀的分子格式,然后直接提交多維相似性搜索,最后對搜索結果用AI模型進行全面性質評估。
這個過程非常友好,因為我們在讀文獻的時候突然來了一個靈感,但非常不想打斷靈感打開軟件一點點畫出來,只想趕緊知道究竟有哪些與它相似分子,在這個平臺可以得到很快驗證。
我們的多維相似性搜索,提供了一共7個維度來做這個事情。
為什么目前提供7個維度呢,因為我們也是做了模型training和調整,讓函數整體表示相對比較平滑,不會出現分子指紋斷層問題。

說完了基于配體的虛擬篩選,我們再來講一下基于受體的分子生成。
分子生成是目前人工智能主要的發力點,不管是有監督和無監督學習還是強化學習,都會在這些上面進行發力。
因為分子生成是基于已有分子結構、已有活性,然后學習它們的性質,在這個空間附近擾動,獲得新分子,這種情況下主要利用配體信息,也就是利用鑰匙信息。
當然更多情況下,我們也可以利用鎖信息,也就是利用受體信息對空間進行限制。
化合物空間實際上可能有1064之多,但真正針對到某一個體系肯定不會有那么多,受體信息確定后,空間將被大幅縮小。
左邊程序叫LigBuilder,是我們以前做基于片段的全新藥物設計程序,它能夠在完成全新藥物設計以及多目標優化的同時,產生類藥性很好,可合成性高的虛擬庫。
右邊是AI分子逆合成分析,是我們基于AI模型開發的逆合成方法,如果使用AI逆合成方式,結合全新藥物設計,它的計算效率會有很好提高。

這個流程我簡單說一下,這基本上就是我們分子生成的設計流程。
一般我們會根據項目需求,假設我們選擇了進行基于結構靶標生成,就會先進行一輪生成,然后再基于活性進行優化,優化之后還要對它進行綜合評估。
就像我們前面說的AI模型對于ADMET藥物性質預測以及毒性預測,已經有比較好的效果。
基于現有數據對其中毒性片段會發出一些警示信息;對于某些影響性質片段也能夠做一定指示。
總體來說,我們希望能夠在項目早期得到性質比較好的分子,對后面一系列實驗會有很大幫助。

我簡單介紹一下我們平臺智藥大腦。這個平臺目前有很多個工具組成,需要CADD、AI、藥物化學家、藥理,還有生物靶標上游很多知識匯集。智藥大腦本身是為大家提供了平臺對話工具,是真正用AI來驅動研發。

接下來我來說一下我的看法。
首先,AI輔助藥物設計這件事情,目前肯定是正在開啟一個新的時代,它肯定能夠讓藥物的研發更快,成本更低,效率更高,尤其是去年AlphaGo2橫空出世,確實也給我們很大震撼,真的覺得AI能夠幫到藥物研發。
其次,制藥工業在我們國家確實是進入換擋提速的過程,我們也緊跟國外創新藥先進治療方法,有些時候甚至是需要提前布局。
但目前AI還有很多問題,對于AI輔助藥物設計這種方法以及實用性仍還存在問題。諸多瓶頸問題依然限制著AI方法和技術在創新藥物研發中的應用,目前多數AI輔助藥物設計方法和系統的實用性仍需努力。
智藥大腦最后完成之后,還需要大家一起來評價,不是簡單的AI模型堆砌,而是針對實際新藥研發問題應用場景,開發和整合多個底層AI藥物研發工具和工作流程。
它本身就是集成了很多業界認可的一個藥物設計工具,底層很強調基于物理原理的科學解釋和對生物學機制的理解。
我們也希望智藥大腦能夠已經被業界認可的計算機輔助藥物設計工具,提供基于物理原理的解釋,為醫藥企業和藥物研發機構研發自主知識產權創新藥物提供完整實用的解決方案。
最后是整體總結和展望。
藥物研發本身肯定是非常復雜極具挑戰的過程,因為周期比較長,所以這個過程中任何一個失敗都很難接受。所以AI的技術發展,為整個制藥行業提供了一個新的機遇,當然挑戰也是有的。
目前來看,主要就是在每一個環節和模塊上,都有很高不確定性,對這些不確定性,我們能夠提供更多證據鏈來盡可能降低不確定性,例如:
基于現有數據構建AI模型預測來提供基于統計的證據鏈;
基于現有數據構建AI模型預測來提供基于統計的證據鏈;
利用理論計算模擬提供一些可解釋的證據鏈;
專家基于經驗和各類證據鏈進行合理的實驗設計和驗證;
利用新一輪的實驗數據迭代優化AI模型和理論計算模型,從而提供新的證據鏈。
Q1:請教一下,您覺得目前做業務的核心壁壘在哪里?
張偉林:我們國家最近也在做交叉學科的布局,以前我們交叉學科研究院已經有過一些實踐。
其實不同領域的人面對的問題難點是不一樣的。
比如我以前是做計算模擬,其實到現在還是覺得有些IT問題對我來說是一個問題,但這些問題對于IT專業人員來說覺得不是問題。
Q2:AI發現出來的藥物最大的難點是在分子合成砌塊?
張偉林:我覺得這不一定是最大難點,因為可以結合比較簡單反應來做,這一點我們和有機化學家如果能夠有充分合作,和他們進行交流,有機合成到底應該是怎么做。
以前都是從前往后設計,到最后反饋合成出問題就前功盡棄,對于寫算法的人來說,他可能沒有專業知識,他沒寫這些限制,所以最后就會出問題,所以分子合成砌塊我覺得并不一定是最大的難點,但確實是一個比較重要的點。
Q3:如何看待AI用于晶型預測劑型這兩個環節的價值?
張偉林:還是非常有價值的,因為晶型預測和劑型預測,以前只能通過實驗來做,但目前這個領域可以用AI來進行處理。
晶型其實定義更廣泛一些來說,它其實是材料范疇,物理化學規則更嚴,所以說它能夠獲得很好數據,也能夠很好反饋到上游。
Q4:用AI篩選的藥物如何平衡活性與毒性?
張偉林:這件事情我們可以做這樣一個假定,假定靶標本身沒那么大毒性。
因為但靶標處在復雜的生物網絡中,那么稍微干預一下靶標,可能整個網絡系統都壞了,這也就意味這個靶標毒性很高,那治療窗口就比較窄,這種情況下有可能應該換靶標或者使用靶標組合。
所以如果靶標選的好,它的治療窗口就會比較寬,活性和毒性平衡也就會比較容易,所以靶標一定要慎重考慮好好選擇。
Q5:AI研發到達成熟估計得多久?
張偉林:這個問題其實很難回答,因為比如初代Alpha fold跟同期一些程序相比優勢還不是特別明顯,但到下一代集成很多專家、數據以及算力之后,就達到非常高的水平。
這其實是一個迭代過程,所需要用到的資源可能不是一個小單位能夠負擔得起,當然目前國內一些課題組做得都非常好,也開發出一些非常先進的工具,但我們還需要繼續向人學習。
我舉個簡單例子,雖然Alpha fold2對于一些本身結構比較好的蛋白,它已經能夠做一個預測,但要說真的解決結構問題,還需要做實驗。
所以AI藥物研發達到成熟需要多久,我覺得會一直在路上,因為現在一些算法本身到了一定程度以后就不更新,可能就需要等它成熟以后,五年甚至十年才能知道這件事情,來告訴我們答案。
Q6:AI研發的原始數據獲取來源都有哪些?
張偉林:還是很多數據來源的,例如公開數據來源、自有數據來源等都很重要,但最重要還是如何理解這些數據質量控制,質量控制是最重要保證。
如果一個數據量很大,里面什么數據都有,例如在某一個靶標活性里面,把各種各樣東西甚至是沒法比較東西都放在一起就會很麻煩。
Q7:AI平臺physics-based modeling比較其他模型有什么優勢呢?
張偉林:AI平臺操作里一個特點就是有物理原理在里面之后,其實可以通過其他物理原理來對它進行檢驗,也就是可解釋性是非常好,這是physics-based modeling本身的一個特質。如果別的AI模型,具有理解這種底層進行劃分的話,同樣可以很好。
Q8:英飛目前有哪些產品和管線呢?
張偉林:目前我們的產品主要是智藥大腦這個平臺,供內部使用,也相當于是不斷打磨內測過程;然后還和我們一些合作伙伴進行應用場景探討。
Q9:請問英飛有大分子藥物的管線嗎?
張偉林:我們主要部署管線是抗病毒癌癥方向,當然大分子也有很多好處,大分子本身特異性還蠻好的,如果我們經費再高一點,計算資源多一點,大分子藥物我們也會考慮去做,但目前我們并沒有計劃在大分子藥物上進行布局。
Q10:我是在校計算化學學生,最近也在自學CS,您介紹基于配體分子篩選-多維度相似性搜索,其中將文獻中結構式識別成電腦能懂的語言,是需要通過圖像識別算法去實現嗎?
張偉林:覺得廣義上主要看你想怎么做,就是具體用什么算法來實現這個目的,而且還是要看算法能不能滿足最終目的。
圖像識別算法實際上是可以的,就是文獻結構中識別為電腦能懂的,圖像識別還是個蠻不錯的算法,因為可解釋性更好。
Q11:請問像英飛這樣的AI輔助藥物研發公司的商業模式是怎樣的?
張偉林:主要商業模式是這樣,我剛才提到我們是以創新藥為最終目標,所以我們致力于開發一個用AI技術平臺,基于平臺驅動開發創新藥物產品管線。
但新藥研發的流程很長,所以也會和其它單位進行合作,大家一起做確實能夠形成優勢互補。
Q12:請問在治療疾病方面,大分子藥物與小分子藥物哪種應用更廣?哪種更有前景?
張偉林:治療疾病這件事有時候診斷更重要,因為診斷對了之后,用對了藥才會有實際效果,如果診斷不對的話,實際很難講存活率和效果。
例如癌癥5年存活率,例如PD1響應率,這些成功率都還在于對疾病機理的理解,也就是一個疾病還沒有清楚原因的時候,很難講選擇什么樣的路徑。
但大分子本身就是因為本身比較大,性質比較穩定,所以基礎性質比較好,小分子好處在于生產比較容易,保存比較方便,所以很難講哪個更有前景,應該是并重的。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。