<label id="jgr5k"></label>
    <legend id="jgr5k"><track id="jgr5k"></track></legend>

    <sub id="jgr5k"></sub>
  1. <u id="jgr5k"></u>
      久草国产视频,91资源总站,在线免费看AV,丁香婷婷社区,久久精品99久久久久久久久,色天使av,无码探花,香蕉av在线
      您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
      此為臨時鏈接,僅用于文章預覽,將在時失效
      醫療AI 正文
      發私信給任平
      發送

      0

      專訪上海市生物醫藥技術研究院戴文韜:生信,為何是生物醫學研究的「隱秘支柱」?

      本文作者: 任平 2024-04-28 10:56
      導語:當一個青年學者,決定把「冷板凳」坐熱。

      專訪上海市生物醫藥技術研究院戴文韜:生信,為何是生物醫學研究的「隱秘支柱」?把“冷板凳”坐熱了,是當今生信人的一大喜悅。

      在科研舞臺上,生物信息學(Bioinformatics)有著雜糅而成的名字,卻僅為角落里不起眼的存在。

      其原因不外乎:“太新”“太交叉”“太應用導向”,以上三者使得很多人認為這一學科不成體系,沒有理論根基。

      此外,生物信息學易學難精,從業人員需要生物學知識的同時,還需掌握計算機科學和統計學等領域的技能,更要融匯數學物理的抽象邏輯思維,這種跨學科的要求又限制了該領域的普及速度。

      時至今日,國內生信人仍處在尷尬境地:主導合作機會較少、長期背負著“打雜”的標簽。

      但不可否認的是,生信早已融入整個生物醫學領域,并推動其研究方法和思維模式的持續變革,提供了高通量跨尺度多模態數據分析挖掘、藥物設計、疾病機理系統研究等核心功能,是連接生命科學與計算科學、推動精準醫療和轉化醫學發展的關鍵學科。

      默默無聞,卻堅韌地支撐著生物醫學研究的“骨架”。

      與生信的實際效用相比,其聲名處于波粒二象性,時而代表生物醫學研究走向數字化智能化的未來,時而又是所謂“水文”泛濫的助力,這既代表著大家對這個新興學科的關注,也說明全面客觀了解這一學科的必要性。

      近期,2024年度「第二屆生物信息與轉化醫學大會」落下帷幕。本屆大會以 “人工智能時代的轉化醫學”為主題,由北京攜云啟源科技有限公司承辦。

      來自上海市生物醫藥技術研究院的戴文韜研究員,以其在多組學整合和計算結構分析挖掘方法領域的深入研究,以及在腫瘤信息學和生物大分子藥物設計優化方面的豐富應用實踐經驗,成為本次會議的組織者及分論壇主持人。

      借此契機,雷峰網與戴文韜進行了深入對話,以一位畢業十年的基層年輕科研人員視角,探討了他為何堅守在生信的道路上,以及他眼中的生信前景。

      實際上,在生物信息學尚處于起步階段時,戴文韜便投身其中,成為了國內最早一批生物信息學博士生。

      在中科院生物物理研究所讀博期間,他的研究課題聚焦于蛋白質折疊與三維結構預測。他表示,這一領域在當時雖然小眾,卻為他日后的研究打下了堅實的基礎,比如統計熱力學、分子模擬和分子力場的知識儲備,以及數據挖掘和算法開發的落地實踐經驗均起源于那時。

      2014年,在面臨職業選擇的十字路口,戴文韜放棄了轉行互聯網或游戲設計的機會。

      他解釋道,盡管互聯網和游戲行業當時發展迅速,對人才求賢若渴,并且同生物信息在技能上有一定的共通之處,但他最終還是選擇了繼續在科研的道路上深耕。

      如今,戴文韜的科研軌跡已經十分明晰。他提到,受到“科學四象限”中“巴斯德象限”的啟發,他將“應用需求引起的基礎研究”作為自己科研工作的主導方向。

      至于生物信息學者能否成為科研的中心力量,他也給出了自己的回答:“正如社會分工的多樣性,每個領域都有其不可替代的價值,不同環節共同構成完整的產業鏈。我的目標只有一個,在自己從事的細分研究領域,做出特色成果,解決實際問題,融入產業價值鏈,給為他人帶來幫助。”

      以下為對話(經編輯):

       國內最早一批生信博士生的出路

      雷峰網:請您分享下教育背景和研究經歷,以及這些經歷如何塑造了您的專業技能和研究視角。

      戴文韜:我是2004年進入華東師范大學生命科學學院,主修生物技術。2008年,保送至中國科學院生物物理研究所碩博連讀,加入了蔣太交教授的課題組,專注于生物信息學的研究,并于6年后畢業獲得生物信息學博士學位。

      實際上,在我讀博期間,國內生物信息學還處于起步階段。因此我也算是國內較早一批獲得生物信息學學位的博士畢業生。

      在我的博士研究中,我專注于蛋白質折疊與結構預測的課題,這在當時是一個相對經典但小眾的領域。但幸運的是,在我個人研究的早期階段,就與許多老師和團隊建立了聯系,得到了很多前輩的指導幫助和鼓勵,例如中科院計算所卜東波老師在中關村開設的算法課程我也有過旁聽,而卜老師也參加了我的博士畢業答辯。

      關于研究視角,由于我所面臨的課題非常具有挑戰性,需要嘗試各種方法。

      最初,我們嘗試采用統計熱力學、分子模擬和分子力場的方法進行研究。然而,到了2010年,我意識到傳統計算方法的局限性,開始探索機器學習方法。

      盡管神經網絡當時已經開始流行,不過不同于CNN為代表的深度神經網絡,效果并不好;加上數據量和其它因素的限制,我們選擇了支持向量機(SVM)。

      2012年CASP10比賽中,我們團隊利用SVM融合序列、結構拓撲和統計分子力場特征,進行蛋白質三維結構模型選擇,形成的創新方法,與實驗室前期主鏈和側鏈預測方法共同構成了一套相對獨立完整的技術體系,取得不錯表現,后續也發表了相關論文。這些研究成果現在依然可以在網上找到,代表了蔣太交課題組在蛋白質三維結構預測領域的探索和貢獻。

      所以,如果要說我的專業技能和研究視角是如何塑造的,可以說困境使然,讓我不斷在限制性條件下尋找可行的解決方案。

      在那個時代,由于缺乏現成的數據庫和工具包,我們不得不從零開始構造模板庫并編寫許多程序,嘗試了各種可能的方法。這一過程不僅讓我掌握了生物信息學領域所需的專業技能,還對物理、統計、計算化學、機器學習與數據挖掘等多個領域有了比較深入的認識和理解,后來我發現在跨領域合作和解決實際問題中,這些積累很有助益。 

      雷峰網:十年前,為什么加入“上海生物信息技術研究中心”?

      戴文韜:2014年博士畢業時,我面臨幾個選擇。一是出國做博士后,這是一個比較傳統的選擇;二是轉行,比如進入互聯網行業,包括游戲產業。

      之于前者,當時經典的蛋白質折疊和結構預測領域在國內相對沉寂,難以找到相關的就業崗位。如果想要繼續從事計算結構生物學研究,唯一的選擇似乎是出國。

      之于后者,當時互聯網及游戲行業對機器學習和幾何三維建模相關的人才需求很大,尤其在游戲領域,進行從3D引擎到數值優化等多種工作,可遷移使用此類專業知識。

      此外還有一層原因是,互聯網及游戲行業的蓬勃發展,提供了非常有競爭力的薪酬待遇和大量工作機會,促使年輕科研人員轉行尋求發展機會。

      盡管如此,我仍然希望能夠投身于科研工作,能夠做一些實際應用,為人類帶來貢獻和幫助的研究。

      這時,上海生物信息技術研究中心的腫瘤精準醫療方向,以產業化研發為導向,包括PDX模型與多組學和計算結構生物學相關研究和應用,對我而言符合興趣,從而具有了很大吸引力。

      在這樣的環境中,為PDX(患者來源的異種移植模型)項目提供數據管理和分析挖掘信息化解決方案,本身就是一種典型的應用基礎研究,加上該中心是當時中國首家以生物信息為主業的獨立法人研究機構,李亦學老師擔任該中心的主任,李園園老師擔任課題組長,有這樣優秀的前輩們推動,我便堅定了加入的決心。

      我們當時希望將生物信息學,特別是多組學相關技術與PDX模型結合起來,探索腫瘤精準醫療的可能性。

      后來,上海生物信息技術研究中心、國家人類基因組南方研究中心、上海市計劃生育科學研究所,三家單位共同組建了“上海市生物醫藥技術研究院”,其核心職能是承擔人口健康與生物醫藥領域關鍵共性技術、顛覆性技術和重大產品研發、應用轉化與技術服務。同時,因為腫瘤精準醫療,在領導帶領下我便與上海交通大學附屬瑞金醫院(尤其是消化外科研究所),以及上海市胃腫瘤實驗室建立并保持了密切合作。

      雷峰網:您目前在上海市生物醫藥技術研究院的團隊規模如何?

      戴文韜:我們是上海市生物醫藥技術研究院組學研究與應用課題組,屬于上海市疾病與健康基因組學重點實驗室,課題組長是李園園老師,我作為聯合課題組組長,團隊規模目前在十人左右,比較精干。感謝上海生研院和李園園老師給了我很大的科研自由度,這對于從事探索性創新的研究人員非常寶貴。

      李園園老師自2003年以來就一直在系統生物學領域開展研究,研究方向為復雜疾病相關的生物學系統大數據整合挖掘。主要從事以識別驅動因素及其信息傳遞、交互機制為目的的跨尺度、多模態、多層次數據整合挖掘方法開發,比如開發DCGL等一系列有價值的計算工具;應用于腫瘤、自身免疫病等復雜系統疾病的關鍵調控因子、調控模塊、失調事件挖掘,跨尺度機制探索,機制解釋性標志物及潛在藥物靶標識別,以及疾病關聯網絡研究,取得許多成果。她領導項目團隊非常有創造性地將一些經典重要的比對算法,結合基因組數據應用于食源性致病菌的檢測,成果已應用于旺旺集團的實際生產。

      我本人領導的小組主要針對診斷標志物和藥物研發場景中的產業實際需求,發展轉錄代謝調控相關時空多組學分析技術配套數據庫和方法,研發生物大分子藥物相關設計優化計算方法,并應用于腫瘤精準醫療相關診斷標志物和藥物研發的轉化實踐。

      因此,總的來說,有效支持轉化醫學有應用價值的生物信息研究,將我們課題組凝聚在一起;我們對科研工作和成果轉化的期望是,能夠在產業鏈中打造出具有特色和價值的一環。

       如何把“腫瘤轉錄代謝多組學挖掘及應用”做出特色?

      雷峰網:注意到您當前的研究方向是轉錄代謝調控多組學及應用。其中包含兩塊,一是開發數據庫和計算工具,二是診斷標志物和藥物研發。能詳細介紹下嗎?

      戴文韜:追溯起來,隨著人類基因組計劃的完成,研究重點相對集中在基因組、甲基化、轉錄組等基于NGS的組學領域。近年來,隨著質譜技術的發展,蛋白組、代謝組、脂質組及相關單細胞空間多組學研究變得越來越受關注。

      近五年,我在組學領域的研究主要集中在適用于轉錄代謝調控的計算分析領域,特別是脂質代謝和空間代謝多組學相關整合分析,同時也探索了數字病理與分子組學的跨尺度多模態學習建模,上述工作主要應用于腫瘤及其微環境研究。

      這些研究工作的共性是,針對場景需求和數據特點,靈活使用了多樣化的機器學習手段,并得益于跨學科合作者的支持,才能順利進行。例如,北京攜云啟源,吳謙副研究員等合作伙伴,在脂質組研究領域給予我大力支持。跨尺度多模態學習建模得益于上海交通大學醫學院附屬瑞金醫院劉炳亞教授和上海交通大學計算機系楊旸教授支持,同時劉老師團隊還對我們挖掘到的計算結果進行了一系列實驗驗證,取得了有價值的發現。中國醫學科學院藥物研究所賀玖明教授、齊魯工業大學(山東省科學院)孫成龍教授,他們在空間代謝組學檢測方法領域的工作非常出色,同他們合作時學習收獲很大。

      我們很多方法策略是為了解決診斷標志物和藥物研發中的實際問題而發展,后續也在應用中取得了不錯的效果。因此,對于我的研究,產業轉化應用非常重要,既是下游工作場景,也是上游需求活水。

      在診斷標志物研發方面,我們基于組學領域的積累開發了一些基于差異調控識別具有機制解釋力診斷標志物的計算方法,用于腫瘤伴隨診斷標志物研發效果不錯,申請獲得了相關知識產權,包括專利和軟件著作權。部分成果同企業合作緊密,進行了轉化探索。然而,由于大環境的影響,診斷標志物的成果轉化目前并不算好時機。不過,我們的相關研究仍在繼續,相信未來終會改觀。

      在藥物開發領域,我有幸參與了一些抗體和特殊治療性蛋白質藥物的結構設計與改造優化工作。針對研發場景中的一系列實際問題,比如調節親和力、消除非特異性脫靶、克服CMC成藥性困難等。我不僅利用專屬序列比對、深度學習、結構模擬等計算方法挖掘序列和結構信息,而且積極通過轉錄、蛋白、代謝等高通量組學手段獲取有效信息;更充分借助生物、化學理論、免疫信息和蛋白質工程領域的經驗知識及工具,通過視覺審查等人工手段實現創造性的決策優化,支持實驗研究人員高效解決了相關問題。“人機結合迭代,知識數據融合”彌補了高質量標注數據不足和通用計算模型在具體場景不適用的短板,我們的策略方法已在scFv、TCR、VHH、T細胞抗原表位肽等多種形式的蛋白質藥物研發中有過成功案例。雖然還沒有找到理論上的通用方案,但算是工程上有意義的實踐,達成了降本增效的目的。

      雷峰網:您和團隊也在做數據庫嗎?

      戴文韜:是的,高質量數據是計算方法的重要基石。我們去年與攜云啟源合作發表了一個名為“人類脂代謝相關脂質和蛋白數據庫(DBLiPro)”的數據庫。

      這是一個細分的專業領域數據庫,系統地收錄了與脂質代謝相關的各種蛋白質,并提供了多種特色高質量標注信息,以及適合以脂質為中心多組學整合挖掘分析工具。

      我的工作往往專注于非常專業的小領域,這些細分領域往往是研發鏈條中缺少的某個細分環節,我們的目標就是補充這一環。 

      雷峰網:您在進行腫瘤多組學數據整合和分析時,采用了哪些方法和技術,遇到過哪些挑戰?

      戴文韜:在進行腫瘤多組學整合分析時,我們團隊采用了一種知識和數據融合驅動策略,靈活使用圖神經網絡、隨機森林、遺傳算法、多種統計回歸等,研發適用于多組學數據挖掘和機制解釋性標志物發現的差異調控分析方法。

      目前該方法用于胃腸道腫瘤為代表的復雜疾病研究,識別具有機制解釋力的關鍵調控因子和關系,助力發現潛在藥靶和標志物;得益于實驗合作伙伴,比如瑞金醫院劉炳亞教授團隊,我們共同驗證了計算發現的一系列新的胃癌關鍵調控基因和作用關系。上述實踐推進轉化醫學產生新知識的同時,驗證了我們計算方法的有效性。

      在這個過程中,我面臨很多挑戰,同時發現大數據和人工智能技術在生物信息學中的應用和潛力是巨大的,不過需要同場景需求和實驗工作者密切合作,多角度相互促進,避免自我循環論證。

      因為過去很多時候,生物信息學的研究可能會讓人覺得“做了肯定好,不做也沒什么”,這顯得有些尷尬。但是,高通量多組學技術天然需要大數據和AI的加持,會推動生物醫藥和生命科學進入數字化智能化時代。

      在這一過程中,我認為最大的挑戰是,我們不能僅僅滿足于生物信息學的計算分析和挖掘,而應該充分了解待挖掘領域的知識和需求,同具體領域專家一起推動研究成果的實驗驗證,并形成正向的反饋迭代。畢竟,生命科學和生物醫藥領域本質上是實驗科學。

      雷峰網:在轉錄代謝調控領域,除了您所在的團隊,國內外還有哪些團隊在這一領域做出了杰出的工作?

      戴文韜:在代謝領域,大家可能首先會想到上海交大醫學院附屬瑞金醫院的寧光院士、武漢大學的宋保亮院士、廈門大學的林圣彩院士、大連化物所的許國旺教授等知名科學家。

      我們的研究方向是腫瘤的轉錄代謝調控,更準確地說是基于高通量組學的轉錄代謝調控系統生物學,專注于腫瘤轉錄代謝調控的高通量組學分析方法研發和應用。相對于經典代謝領域,我們屬于系統生物學的代謝多組學,是相對邊緣的新興學科。中科院北京生命科學研究院趙方慶研究員、加拿大麥吉爾大學夏建國教授、上海交通大學王卓研究員等科研人員,從不同角度通過出色工作推動了代謝多組學數據分析方法,大家共同推動該領域更好地發展,并服務于生物醫學。

      因為我們團隊規模較小,所以希望能夠做出特色工作,與其他團隊形成互補的合作關系,通過關注應用的成果,助力推進基礎研究前沿成果的產業轉化。 

      雷峰網:后續您和團隊在前沿研究和成果轉化上,有哪些規劃?

      戴文韜:我希望能夠在未來幾年,圍繞自己的研究領域,做一些場景導向的、有特色應用價值的成果。

      我希望針對未滿足的生物醫藥關鍵共性場景需求,融合領域知識和高質量數據,研發轉錄代謝多組學分析和生物大分子藥物計算設計優化方法,應用于診斷標志物和藥物的發現,特別是新型生物大分子藥物的發現。

      代謝組學不僅可以用于標志物的發現,還可以幫助解釋藥理作用,包括藥物的耐藥性、敏感性以及ADMET特性(吸收、分布、代謝、排泄、毒性)。生物大分子藥物,因其自身特點,在安全性、有效性、可成藥性等方面有著完全不同于小分子化學藥物的需求,這都對計算設計優化提出了獨特訴求。

      個人認為AI通用大模型是人類的追求,但在我所從事的應用基礎和轉化研究領域,應該尊重具體領域的已有積累和客觀規律,循序漸進,小步快跑推進落地,比如云計算和邊緣計算不是替代關系,而是互補增效關系。我希望將主要精力集中在細分領域上,尋找好的合作伙伴,共同推進成果轉化。

      當然,每個人內心都有一股推動產業鏈發展的沖動,想要將一個產品從實驗室原型推向最終產品。但在實際工作中,我始終堅持需要克制這種沖動。

      因為術業有專攻,在成果轉化方面,產業鏈是很長的一環,確實有杰出的人才能夠全面掌握,但坦白說,我目前并不具備這樣的能力。我只是一個年輕的基層科研人員,所以我對自己的定位是專注于產業鏈中的特定環節。

      我的目標是在產業鏈的特定環節上做出特色,創造出有價值的工作,成為產業鏈中不可或缺的一部分。至少,我希望能夠在這里打造出具有特色且對他人有幫助的一部分。

      應用VS理論、合適VS先進

      雷峰網:如果抽象來說您當前的工作,您和團隊是否有一套科研觀念,以及您是如何在前沿基礎研究與技術轉化之間架起橋梁的?

      戴文韜:我可以用“科學四象限”來回答這個問題。 

      專訪上海市生物醫藥技術研究院戴文韜:生信,為何是生物醫學研究的「隱秘支柱」?

      這個圖展示了四個象限,每個象限代表了一種研究模式。縱向的兩端分別越接近理論、應用;橫向的兩端分別越接近知識的發現、數據的積累(即使我們可能無法直接發現新知識,但我們可以有效地積累數據)。

      這就產生了區別:

      第一象限側重于理論和知識發現,這是典型的基礎研究,有時被稱為波爾象限或牛頓象限。

      第二象限側重于理論和數據積累,被稱為整合經驗或技能訓練的象限,有時被稱為第谷象限或皮特森象限。

      第谷是天文學家,他一生完成了當時最完整的天文觀測資料,但他堅持地心說,因此沒有取得重大發現。而繼承了他所有數據資料的是開普勒,開普勒從這些資料中推斷出了行星運動,命名為開普勒三定律,這逐漸過渡到了牛頓的萬有引力定律。這就是第谷象限和牛頓象限之間的關系。

      第三象限側重于經驗、數據積累,屬于純應用研究,典型的代表是愛迪生。他通過大量實驗找到了適合制作電燈的材料。例如,為什么白熾燈的發展會用到鎢絲,研究者可能并不關心其性能為何優越,只知道它好用就足夠了,這是一個純應用的象限。

      第四象限側重于應用引起的基礎研究,代表人物是巴斯德。

      巴斯德在防止紅酒和牛奶變質的過程中發明了巴氏消毒法,但他同時也做出了重要的科學發現——微生物的存在。這一過程是典型的從應用需求出發,為了更好地滿足這一需求,進而推動了知識的進步。

      實際上,我從上海生物信息技術研究中心開始,個人研究方向就已經進入了巴斯德象限,而我現在參與到“上海市生物醫藥技術研究院”中更是如此。

      如果用一句話來概括我的研究重點,就是專注于轉錄代謝調控相關的時空多組學和生物大分子計算體系的研發及應用。

      這不是純粹的理論研究,強調以應用需求為出發點,旨在滿足應用目的,但同時也會帶動新知識的發現,進而指導形成更有效的工程化解決方案,這其實是一個知識發現落地反饋迭代優化的閉環。

      因此,我對串聯前沿基礎研究與技術轉化的理解是:

      首先要場景導向,明確在特定場景下我們需要什么;

      其次以產業場景為導向,針對產業需求,將前沿基礎研究中的合適理論和技術應用到問題的解決中。

      合適的解決方案并不意味著它一定是最新或最先進的,但它必須是最適合當前條件的,因為時間和資源都是有限的。

      更近一步說,我對“智能”的理解在于,無論是人工智能還是其他形式的智能,其重要性在于能夠在有限的資源和時間內,為問題提供一個相對可行的解決方案。最好是能夠從這個解決方案中進行理論升級,即從應用到知識的轉化。

      雷峰網:如果將人工智能的發展分為幾個里程碑,比如統計學習、機器學習、深度學習等。那么如今的大語言模型對于您目前從事的腫瘤轉錄代謝調控和生物大分子藥物計算研究有何影響?

      戴文韜:在進行空間多模態數據分析時,深度學習在圖像處理方面確實帶來了新的突破。未來,對于文本相關的多模態數據分析,大語言模型將會發揮重要作用。

      但大語言模型并非萬能,仍需要與數據相適配。

      比如,在組學數據挖掘中,盡管我們嘗試利用了一些領域知識,但可用的高質量數據仍然較少,單純依靠算法和數據驅動難以解決問題。

      再比如,在生物大分子藥物研究過程中,具體藥物研發管線和案例,往往沒有足夠的高質量標注數據來進行訓練,通用模型難以落地應用。

      盡管現在大家也在討論零樣本(zero-shot)和少樣本(few-shot)學習方法,但面對梯度爆炸等問題時,遺傳算法等技術,在很多時候仍然是一個很有效的解決方案。

      因此我的觀點是,研究始終應該是場景和需求導向。

      過去學術研究有個常見問題是“拿著錘子找釘子”,而沒有考慮到可能需要發展其他工具。

      但事實上,在工業軟件中,小模型仍然占據主流,這類似于前幾年大家都在討論云計算,但最終發現僅有云計算是不夠的,還需要邊緣計算。

      因此,對于大數據和人工智能,我認為在解決實際問題時,找到最合適的解決方法是最重要的。我們不應該只是追隨潮流,而應該針對具體的應用場景和需求,找到最合適的解決方案。

      當然,我非常積極地擁抱大型語言模型。實際上,我每天都會使用國內外的多種大型語言模型,并在研究中已經在有所應用。我也會告訴我的學生,在大語言模型技術領域,我們站在同一條起跑線上。不過,以大語言模型為代表的AI技術,已形成資源需求巨大,產業界主導的趨勢,這對于更自由靈活的學術和技術團隊在該領域的研究和應用構成巨大挑戰,長遠看會制約技術生態多樣性和實際落地,個人認為該趨勢和挑戰非常值得重視。

      歸納一句話,在解決具體問題時,我認為“不管黑貓白貓,能抓到老鼠的就是好貓”。

      雷峰網:這次在大會上,有哪些人的報告讓你特別感興趣?

      戴文韜:我對這次會議中的三個主題非常感興趣。

      首先是腫瘤多組學整合研究與轉化應用。

      其次是單細胞時空多組學的應用越來越廣泛。在這兩部分中,可以看到知識庫和數據庫發揮了重要作用。

      第三部分是臨床隊列與轉化醫學,這涉及到大數據的采集、管理和應用。

      簡而言之,這三個主題可以歸納為腫瘤多組學整合研究與轉化應用、單細胞多組學,以及支持這兩個領域的數據庫,進而是更為基礎源頭的自然人群和臨床大隊列。

      在會議上,我的感受是生物醫藥正在迅速進入一個真正的大數據時代,包括隊列研究和組學研究,也正在從過去的靜態單點式研究進入到時空多組學的時代。

      在這次會議上,公開場合的報告中還沒有看到很多關于大語言模型的工作,但在會議交流中,大家都非常關注這一領域。我認為在未來兩年,這類工作會逐漸增多。大家已經廣泛地將大型語言模型作為日常助手使用。 

      生信人迎來春天了嗎?

      雷峰網:您如何看待當前中國生物信息學和轉化醫學領域的科研環境?您能否根據自己的經驗,談談如何推動跨學科領域合作,以及對于年輕人的建議?

      戴文韜:關于生物信息學和轉化醫學領域的科研環境,每個人可能都有自己的感受。

      我自己自2008年進入生物信息學領域,從早期開始就一直在這個環境中成長。生物信息學至今尚未沒有自己的一級學會,但在生物醫學領域中,它確實是一個重要的輔助學科。就像社會分工一樣,每個領域都有其獨特的價值。我們要做好自己的本職工作,為大環境做出貢獻。

      隨著時間的推移,相比當年,生信這個領域已經得到了更多的認可。

      在當下時代,有組織的科研得到了大力提倡,這是科研范式變化的結果。在有組織科研和當前科研環境下,自由探索型團隊越來越感受到,自由并非沒有代價。但我認為學術自由仍然是最寶貴的,對于細分特色和非共識研究領域尤其如此;上海市生物醫藥技術研究院和李園園老師為我提供了相對自由的學術環境,對于部分科研人員這是很難得的事情。從生態進化角度,多樣性是應對不確定性的最佳手段[WD6] ,在當前這個大變革的時代,個人認為這個觀點很有價值。

      在跨學科合作方面,我的經驗是首先要彼此尊重,然后是在尊重和信任的基礎上實現互補,這樣才能從彼此那里學到新的東西,有助于合作各方的利益。

      我與物理、化學、藥學、醫學等不同領域的專家都有合作。在合作過程中,尊重不僅體現在對合作者的尊重,更重要的是尊重對方學科的研究歷史、脈絡和研究范式。

      跨學科合作就是尋求互補共贏,比如我與生物物理領域的呂軍鴻教授、分析化學領域的賀玖明賀和孫成龍教授,以及醫學領域的劉炳亞教授等都有合作,我自己在合作中學習收獲很多,非常感謝他們。這種合作最重要的是,一開始的利益和動機要純正,互相信任,實現共贏,這樣合作才能長久。

      至于對年輕人的建議,我聽了您的話后突然意識到,盡管我自認為還是年輕人,但我博士畢業已經十年了。對于年輕人,我的建議是,十年后你在學校學到的知識可能都已過時,與時俱進是關鍵。

      同時,雖然許多具體的技術模式和技能可能已經發生了變化,但我認為十年來思考訓練凝結成的科學思想和意識,發現問題、定義問題、解決問題的能力是不會過時的。

      雷峰網:多年前人們對跨學科并不感興趣,認為只有本領域做不下去的人才會選擇跨學科。但現在,隨著 AI 制藥的發展,以及像英偉達這樣的公司在芯片算力方面的推動,生物信息學變得非常有用。您自己的感受是怎樣的?

      戴文韜:對,這是一個巨大的變化。一批生信領域的前輩從冷板凳走到聚光燈下,他們的感受頗深。

      特別是周耀旗老師,我是他博客的忠實讀者。當年在生物物理所讀書時,每年都要進行考評。有老師直接問我們生物信息專業的學生,你們整天不做實驗,就只是對著計算機敲敲打打,對學科的意義和價值如何。

      當時我們只能尷尬地笑笑,弱弱的表示我們期待未來取得進展。但現在,經過了大約十年的時間,再也沒有人這樣說了。

      更重要的是,這個學科的從業者大多都還活著,再次證明生信是一個非常年輕和新興而充滿未來的學科。

      我可以再舉一個例子,關于我之前提到的科學四象限。

      我的學術研究起步于生物物理研究所的蛋白質折疊與結構預測。實際上,我本科時加入實驗室和進行畢業論文研究時,最初的目標是計算神經生物學,后來發現生物信息學的數據積累更為充分,加上其它原因,我就走上了現在的研究道路。

      但說實話,無論是計算神經,還是生物信息,在當時都是一些非常冷門和小眾的領域,但現在這兩個方向相關的腦機接口與神經解碼、類腦智能,生物信息、精準醫療、CADD/AIDD等領域均已成為不可忽視的熱點研究方向。

      所以說,如果要給現在的年輕人提建議,那就是一句話:首先要選擇自己感興趣且擅長的領域,但不一定要選擇當前最熱門的方向。

      GPT-2.0等模型在技術圈嶄露頭角時,雖然大眾不知道,但從專業角度判斷,新的理論已經構建完成,后面需要工程上的突破和大量的資源。在這種時刻,除非你的目標是進入產業界,否則作為一個年輕的學術人員貿然進入自然語言學習領域的很多方向可能都會很危險。

      雷峰網(公眾號:雷峰網):您的分享非常有啟發性,包括談到一些從事生物信息學的人還能轉行做游戲設計,那么這兩者還有哪些關聯?

      戴文韜:在當時的環境下,生物信息學的就業非常困難,大家都在尋找出路,人總是要先吃飯。

      事實上,游戲行業的發展對技術進步,尤其是GPU技術和強化學習的發展起到了推動作用。這種技術的發展對生物信息學同樣有益,因為生物信息學中的許多計算密集型任務,如三維結構模擬和數據分析,都需要強大的幾何圖形計算能力;另外游戲行業對合成數據技術的推動,對許多領域都非常重要。

      回想我在生物物理所學習時,我最早接觸到了IBM推出的異構計算和多線程處理技術。這種技術在當時是非常先進的,但同時也帶來了編程上的挑戰,因為它要求開發者自己管理浮點運算和字節存儲。

      隨著時間的推移,像英偉達、谷歌、Meta等公司提供的現代編程庫和工具,極大地降低了異構計算和并行化的工程化門檻。這些工具使得非專業程序員也能夠更容易地進行開發和創新。

      有時我問00后學生,他們甚至不知道IBM是什么,這讓我感到驚訝;想來這是時代在變化,江山代有才人出的真實寫照。

      所以說,在合適的時機做合適的事情,非常重要。如果無法確定合適的時機,或者沒有合適的條件,我寧愿不燒熱灶,不追風口,選擇一個自己感興趣的小眾冷門領域,盡管這很有可能失敗,但也有機會做出自己的特色。

      總的來說,技術的進步為各個領域提供了打破藩籬,相互促進的機會,比如生物信息和游戲;而個人則需要根據時代的變化和自身的興趣,爭取一專多能,做出合適的職業選擇。

      本文作者 吳彤 長期關注人工智能、生命科學和科技一線工作者,歡迎同道微信交流:icedaguniang  

      雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知

      分享:
      相關文章
      當月熱門文章
      最新文章
      請填寫申請人資料
      姓名
      電話
      郵箱
      微信號
      作品鏈接
      個人簡介
      為了您的賬戶安全,請驗證郵箱
      您的郵箱還未驗證,完成可獲20積分喲!
      請驗證您的郵箱
      立即驗證
      完善賬號信息
      您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
      立即設置 以后再說
      主站蜘蛛池模板: 国产精品成人免费视频网站京东| 亚洲熟妇色xxxxx亚洲| 亚洲av优女天堂熟女| 人妻中出无码一区二区三区| 亚洲最大成人网站在线观看| 国语精品国内自产视频| 免费精品国产人妻av| 亚洲女初尝黑人巨高清| 桃源县| 中文字幕无码人妻| 两个人xxx性爱视频| 亚洲国产成人一区二区在线| 成人av一区二区三区| 久久久久无码专区亚洲av| 亚洲国产精品久久青草无码| 年轻女教师hd中字3| 午夜成人无码福利免费视频 | 出租屋勾搭老熟妇啪啪| 国产suv精品一区二区69| 久久久国产免费影院| 在线a久青草视频在线观看| 中国极品少妇XXXXX| 亚洲人成网站在线播放942 | 色猫咪av在线观看| 三个男吃我奶头一边一个视频| 男女肉粗暴进来动态图| 国产?亚洲?在线| 亚洲精品美女一区二区| 无码无遮挡刺激喷水视频| 久久精品国产6699国产精| 色婷婷综合激情视频免费看| 国产精品久久久久久久久动漫| 亚洲天堂日韩av电影| 国产精品久久人妻无码网站一区| 国产在线网址| 国产在线视频www色| 亚洲制服丝袜| 亚洲做第3页| 女人喷水高潮时的视频网站| 国产免费爽爽视频| 91综合网|