文章ID:145時間:2025-04-18人氣:
用微信掃碼二維碼

分享至好友和朋友圈
出品|網易科技《態度AGI對話》欄目
所有行業都值得用大模型重做一遍,生物這個被視為門檻極高的行業,也裂開了一道縫,AI科學家們看到了機會。
報告顯示,目前單款新藥的研發成本已經飆升至25.6億美元,而整體開發成功率僅有3.5%。這讓無數藥廠頭痛不已。
好消息是,大模型技術的智能涌現能力和觸類旁通能力已經開始在各行各業發揮重要作用,行業也開始積極采用這一技術。數據顯示,人工智能在生物制藥領域的應用正在不斷擴大。通過大模型技術,藥物的臨床前研發階段(例如,從小分子候選化合物的提名到首次受試者給藥的典型時間間隔2-3年)將顯著縮短,同時藥物的臨床通過率也有望顯著提升。預計在未來幾年內,大模型驅動的生物制藥企業和服務公司將在行業中發揮至關重要的作用。
清華智能產業研究院(AIR)創立伊始就將生物醫藥視作最重要的一個研究方向,并孵化了水木分子,這家公司專注于生物醫藥垂直行業大模型的研發與應用。產品將服務于藥物研發各環節,包括早研立項、靶點發現、分子設計優化、臨床實驗設計、藥物重定位等。
至2024年8月,水木分子累計獲得近億元人民幣的融資,天使輪由華山資本領投,道彤投資、訊飛創投參與投資,清智資本參與了種子輪融資。募集資金將主要用于生物醫藥多模態大模型,以及對話式藥物研發助手工具 ChatDD 產品的研發。
水木分子的首席科學家由博士擔任。他是清華大學國強教授、AIR首席研究員。曾任微軟亞洲研究院首席研究員,主要負責微軟自然語言理解、實體挖掘的研發工作。曾經是阿里巴巴人工智能實驗室北京研發中心負責人和阿里巴巴天貓精靈首席科學家。2004年獲得美國亞利桑那州立大學博士學位,師從美國人工智能學會前主席Subbarao Kambhampati教授。
聶再清告訴網易科技《態度AGI》,生物醫藥行業需要人工智能來賦能,之前做藥的主要途徑是“老法師”做實驗,經驗直覺非常重要。后來雖然有了CADD(計算機輔助制藥),但“老法師”仍然發揮主動權。到AIDD階段,這時候一些AIDD公司宣傳創新藥物可以是AI獨立研發出來,但其實不大可能。
“做藥最好的方式是‘老法師’專家和AI密切地交互結合。”聶再清表示。
聶再清希望打開制藥這個“黑盒子”。他說,水木分子的ChatDD大模型是多模態的,讓專家用自然語言與生物醫藥大模型對話,這可以讓“老法師”更好地理解生物數據,讓生物數據和大模型算法推薦結果更具解釋性?!拔覀兿M麡I界把水木分子與最領先的生物醫藥大模型能夠畫上等號。”
他認為,預計最快未來兩到三年,生物醫藥就會迎來“Chatgpt時刻”?!拔覀兂晒Φ臉酥臼谴蟛糠謩撔滤幬锏难邪l是通過我們的大模型和老法師密切協作產生的,這才是對人類最大的貢獻。”聶在清說。
以下為網易科技對話聶再清博士實錄:
網易科技:您曾就職于微軟亞洲研究院和阿里等公司,是什么促使決定投身“AI+制藥”,出任水木分子的首席科學家?
聶再清:
“ 通用人工智能的曙光”閃現。
在通用智能時代,我希望去從事大模型相關的創新。在通用大模型和行業大模型中,我選擇了行業大模型。太多人去卷通用大模型了,我反而覺得通用模型在TO B端需要通過深入行業才能產生價值。
“蛋白質宇宙”和“生命與自然語言跨模態”成為AI科學家的向往。
選擇生物醫藥,是因為生物醫藥是個特別好的行業,它的生物模態數據的表示學習門檻很高。生命編碼語言和自然語言是有差別的,打比方來說,蛋白質也有其語言體系,已知蛋白質結構有上億種,它是由氨基酸序列組成的,這種序列會決定蛋白質的結構,結構又決定了蛋白質的功能。生命編碼語言也有自己的語法規律,遵循自然選擇的物競天擇法則,需要有獨特的大模型來理解其中的規律。
水木分子孵化于清華智能產業研究院(AIR)。2020年我加入清華智能產業研究院開始做科研。在微軟亞洲研究院也負責過微軟自然語言理解、實體挖掘的研發工作。以前做科研的很多經歷,對從事這個方向非常有幫助。
網易科技:外界比較關注水木分子的藥物研發助手Chat DD,目前Chat DD有了哪些進展?
聶再清:
我在清華大學智能產業研究院帶領團隊,提出一種全新的多模態語義理解框架BioMedGPT,支持分子、蛋白、自然語言跨模態基礎模型。2023年4月,團隊開源了輕量科研版BioMedGPT1.6B。這項技術受到了很多關注,我們覺得可以繼續孵化,打造成一個真正的產品。輕量科研版BioMedGPT1.6B,驗證了將文獻、分子、蛋白、測序、知識圖譜等數據壓縮到統一的多模態大模型框架,可使模型具備“融匯貫通”的能力,在分子性質預測、藥物靶點親和力預測、性質預測、藥物敏感性預測、分子文本跨模態檢索、分子文本跨模態信息生成等多項任務上優于單一專用模型,從研究層面驗證技術可行性。
之前做藥的主要途徑是“老法師”自己做實驗,在這個過程中,“老法師”的經驗直覺非常重要。
制藥的發展經過多個階段。 第一代手工制藥TMDD: 基于經驗主義,依托專家經驗與直覺,通過大量實驗試錯來實現;第二代計算機輔助設計CADD:通過計算機模擬建模,減少了對濕實驗的依賴;第三代人工智能輔助設計AIDD:應用人工智能技術從訓練數據中挖掘藥物發現和設計規律。AlphaFold的問世驗證了人工智能可以產出同實驗室方法精確度相當的蛋白質結構預測結果,但成本卻大幅降低。AIDD通過最近幾年的發展,吸引了大量科技公司涌入該賽道。雖然AIDD應用人工智能技術從訓練數據中挖掘藥物發現和設計規律,但一直面臨訓練數據不足、信息與知識分離、工具服務分散、處理模態單一等挑戰。
可以看出,后來雖然有了CADD,但“老法師”仍然可以發揮主動權。到AIDD階段,算法和“老法師”的交互做得還沒那么好。
有些AIDD公司說藥可以是AI做出來的,但實現還不大可能,一定得要有人參與,最好的方式是“老法師”專家和AI密切地交互結合。
如果能通過一個大模型把所有外部的知識、數據和工具全部整合,再把科研人員的問題通過提示詞傳輸到大模型中,形成交互,把人的知識和直覺與機器理解數據的能力融會貫通,會是比較好的交互方式。
水木分子提出的ChatDD ,將人類專家知識與大模型知識聯結起來,通過自然語言與生物編碼語言協作,打造新一代對話式藥物研發助手,重新定義了藥物研發的模式。它以全新的方式來應對藥物研發中的各種挑戰,為實現高效、精準的藥物研發提供了新的可能性,致力于加速創新藥的開發和上市,同時助力降低研發成本、時間與風險。
網易科技:具體ChatDD是如何在制藥過程中發揮作用?
聶再清:
我們希望ChatDD成為領先地位的生物醫藥行業大模型,它會貫穿在生物醫藥行業的全流程之中。它不僅還具備專業知識力、認知探索力和工具調用能力,目標是助力服務醫藥研發全流程場景,包括立項調研、早期藥物發現、臨床前研究、臨床試驗、藥物重定位等。
比如,要不要立項開發?要不要上臨床?一期通過要不要上二期?在這些問題上,它都可以助力專家去決策,做到有據可依。
生物醫藥大模型可以做很多工作,在臨床前的藥物研發階段,借助大模型進行靶點的決策和小分子的虛擬篩選、優化。在臨床階段,如何讓一個藥更好地通過臨床,這是藥廠非常關心的,我們可以通過大模型去設計臨床試驗。
網易科技:水木分子在開發ChatDD的過程中,團隊遇到了哪些挑戰?
聶再清:
文化差異是最大的挑戰。
人工智能和生物醫藥屬于兩個圈子。大模型屬于互聯網+AI文化,要求是快速迭代、唯快不破,而做醫藥則要穩重,得保證路徑是對的,否則就得推翻重來。所以在團隊建設上需要跨過交叉學科的門檻。網易科技:目前水木分子已經與博奧晶方、復星醫藥等企業建立了合作關系,具體合作模式是什么樣的?
聶再清:
與兩個企業的合作方向不一樣,跟復星醫藥主要聚焦在“立項”這個階段,跟博奧晶方更多是在信號通路挖掘方向。博奧晶方與水木分子合作,基于博奧晶方在中醫藥方向的原創分子本草技術和水木分子的創新算法,重點聚焦以ChatDD-FM和組學大數據形成中藥靶標發現智能體,促進中醫藥理論創新,說清楚、講明白中醫藥療效,助力科學內涵相對清晰、療效確定的中藥新藥研發和精準用藥應用。
復星醫藥攜手水木分子,充分利用復星和水木分子寶貴的專有數據和專家知識,依托水木分子的ChatDD-FM,重點關注自動情報分析和商業價值評估等場景,打造AI助力的創新決策系統。該系統旨在提升傳統人工追蹤海量實時變化行業信息的效率,解決商業評估客觀性和標準一致性的問題,多維度、全方位、快速高效地決定項目的go與no-go,助力提高研發成功率。
水木分子在成立不久獲得客戶的認同,歸根結底是大模型有用,能夠解決業務痛點,除此之外就是用戶對我們的產品、技術充分信任。
網易科技:制藥方面的需求,藥廠有兩個選擇,一是用通用大模型自己訓練,二是用水木分子的行業大模型,您接觸的藥廠有沒有這樣的糾結?
聶再清:
肯定是有的,制藥行業客戶用大模型有不同的需求,也有通用大模型能解決的場景(比方說翻譯)。其實有客戶拿ChatGPT和ChatDD作翻譯方面的比較,會發現我們比通用模型好很多。因為在生物醫藥行業,有很多專用的術語,通用模型翻譯得沒那么好。但是在很多要處理生物模態數據的場景(比方說藥物設計,BioMarker篩選等),客戶就不會有對通用大模型的糾結。網易科技:ChatDD有什么創新點?
聶再清:
ChatDD是多模態的, 讓專家用自然語言與大模型對話。比如用自然語言去問蛋白質的規律。我們可以做到,真正賦能專家和老法師,讓他們更好地理解生物數據,讓生物更有解釋性。
水木分子提出的ChatDD藥物研發助手的目標就是建立一個高效的聯結,把科學家的經驗和直覺,與海量生物數據(分子、蛋白等)、文本、結構化知識的融會貫通,以及各種藥物發現和設計的工具結合起來。通過這種方式,科學家的大腦和大模型能夠相互提示補充,共同推動藥物研發的進程。
大模型最令人驚喜的能力是智能涌現與觸類旁通。生命現象的本質也是一種自然進化的編碼語言。將人類總結的知識與氨基酸、分子、蛋白等數據壓縮到統一的大模型框架內進行編碼和學習,有望理解生物編碼的語言機制,進而從底層推動與生命科學相關的研究與應用。我們致力于打造領先的專注生物醫藥的融合生物編碼+自然語言的多模態大模型。
網易科技:ChatDD在市場上有競爭對手嗎?
聶再清:
有些公司在做生物模態,有些公司在做醫療,但完全定位于做生物醫藥行業多模態研發助手的,水木分子肯定是走在前面的,我們處于領導地位。我們希望水木分子與生物醫藥大模型能夠畫上“等號”,成為生物醫藥行業中的大模型公司。用戶只要一提起生物醫藥大模型就能想到水木分子、ChatDD。
網易科技:ChatDD現在處于第幾個版本?
聶再清:
產品每三個月會有一個版本,很難說具體是哪個版本。因為內部的ChatDD版本本身沒開源。但是對于BioMedGPT的開源已經至少有兩次,一次是16億參數,一個是100億參數。網易科技:團隊有多少人在做產品的研發?
聶再清:
水木分子還在繼續穩步擴張中,目前團隊不超過100人。我們組建了“AI+醫藥”、覆蓋技術、產品、商業化和市場的創始團隊。前IBM阿爾馬登研究院人工智能平臺部門研究負責人、美國國家工程院工程前沿杰出青年工程師喬木博士擔任CTO,他也曾是IBM發明大師和IBM全球技術學院成員;世界500強企業強生前高管、前藥明康德副總裁,擁有三十余年藥物研發、創新技術應用、國際國內合作生態建設經驗的李秀艷博士出任聯席首席科學家;500強藥企藥明康德前副總裁邢杰為首席運營官,負責推進水木分子全球商業化發展等事務;前阿里天貓精靈對話引擎和智能運營技術團隊負責人張鐵蕾任工程副總裁,他還曾任快手商業化事業部業務中臺研發中心負責人。網易科技:ChatDD在數據層面是如何構建的?
聶再清:
我們主要基于公開數據。基于大量的文本數據結合多模態數據、大分子、蛋白質和文本對齊的數據。同時,我們也在建水木分子的知識庫,現在提出一個叫EntityChat的概念,將結構化、非結構化、多模態的資源數據融合在一起,形成實體和別的實體之間的關系圖,實現對一個分子、藥物或靶點的全方位提問。網易科技:當下大模型公司的商業模式大家并不樂觀,水木分子未來有哪些商業化模式?
網易科技:8月水木分子剛宣布融資近億元,如何去花這筆錢?
聶再清:
融資的資金會用在技術和產品的突破上。
首先在生物醫藥的基礎模型上有所突破,希望為行業打造最好的生物醫藥的多模態基礎大模型。其次就是產品研發,我們希望大模型真的能夠幫到行業,解決他們真實的問題。我們會跟資源方做持續性的探討,不斷打磨產品和技術。成功的標志是未來大部分的創新藥物是ChatDD和老法師協作產生的。
網易科技:“AI制藥”作為一個新興領域,您如何看待這個產業的發展現狀,我們處于什么階段?
聶再清:
生物醫藥還有很大的發展空間,整個行業急需一個真正有效的生物醫藥大模型。我判斷,預計兩到三年,生物醫藥會迎來“ChatGPT”時刻。
網易科技重磅推出系列對話欄目《態度AGI》。過去三年,AI變革風起云涌,全球科技秩序正在重構,通往AGI的道路或許正在悄然臨近。本欄目以AGI為題,將對話100位AI專家、企業家、投資人,試圖撥開云霧,與大家一道見證AGI時代的到來。
第十七期對話清華大學國強教授、
AIR首席研究員、水木分子首席科學家聶再清。
出品|網易科技《態度AGI對話》欄目
以下為網易科技對話聶再清博士實錄:
網易科技:您曾就職于微軟亞洲研究院和阿里等公司,是什么促使決定投身“AI+制藥”,出任水木分子的首席科學家?
“ 通用人工智能的曙光”閃現。
“蛋白質宇宙”和“生命與自然語言跨模態”成為AI科學家的向往。
選擇生物醫藥,是因為生物醫藥是個特別好的行業,它的生物模態數據的表示學習門檻很高。生命編碼語言和自然語言是有差別的,打比方來說,蛋白質也有其語言體系,已知蛋白質結構有上億種,它是由氨基酸序列組成的,這種序列會決定蛋白質的結構,結構又決定了蛋白質的功能。生命編碼語言也有自己的語法規律,遵循自然選擇的物競天擇法則,需要有獨特的大模型來理解其中的規律。
網易科技:外界比較關注水木分子的藥物研發助手Chat DD,目前Chat DD有了哪些進展?
有些AIDD公司說藥可以是AI做出來的,但實現還不大可能,一定得要有人參與,最好的方式是“老法師”專家和AI密切地交互結合。
網易科技:具體ChatDD是如何在制藥過程中發揮作用?
我們希望ChatDD成為領先地位的生物醫藥行業大模型,它會貫穿在生物醫藥行業的全流程之中。它不僅還具備專業知識力、認知探索力和工具調用能力,目標是助力服務醫藥研發全流程場景,包括立項調研、早期藥物發現、臨床前研究、臨床試驗、藥物重定位等。
網易科技:水木分子在開發ChatDD的過程中,團隊遇到了哪些挑戰?
文化差異是最大的挑戰。
網易科技:目前水木分子已經與博奧晶方、復星醫藥等企業建立了合作關系,具體合作模式是什么樣的?
網易科技:制藥方面的需求,藥廠有兩個選擇,一是用通用大模型自己訓練,二是用水木分子的行業大模型,您接觸的藥廠有沒有這樣的糾結?
網易科技:ChatDD有什么創新點?
ChatDD是多模態的, 讓專家用自然語言與大模型對話。比如用自然語言去問蛋白質的規律。我們可以做到,真正賦能專家和老法師,讓他們更好地理解生物數據,讓生物更有解釋性。
水木分子提出的ChatDD藥物研發助手的目標就是建立一個高效的聯結,把科學家的經驗和直覺,與海量生物數據(分子、蛋白等)、文本、結構化知識的融會貫通,以及各種藥物發現和設計的工具結合起來。通過這種方式,科學家的大腦和大模型能夠相互提示補充,共同推動藥物研發的進程。
大模型最令人驚喜的能力是智能涌現與觸類旁通。生命現象的本質也是一種自然進化的編碼語言。將人類總結的知識與氨基酸、分子、蛋白等數據壓縮到統一的大模型框架內進行編碼和學習,有望理解生物編碼的語言機制,進而從底層推動與生命科學相關的研究與應用。我們致力于打造領先的專注生物醫藥的融合生物編碼+自然語言的多模態大模型。
網易科技:ChatDD在市場上有競爭對手嗎?
我們希望水木分子與生物醫藥大模型能夠畫上“等號”,成為生物醫藥行業中的大模型公司。用戶只要一提起生物醫藥大模型就能想到水木分子、ChatDD。
網易科技:ChatDD現在處于第幾個版本?
網易科技:團隊有多少人在做產品的研發?
網易科技:ChatDD在數據層面是如何構建的?
網易科技:當下大模型公司的商業模式大家并不樂觀,水木分子未來有哪些商業化模式?
網易科技:8月水木分子剛宣布融資近億元,如何去花這筆錢?
融資的資金會用在技術和產品的突破上。
成功的標志是未來大部分的創新藥物是ChatDD和老法師協作產生的。
網易科技:“AI制藥”作為一個新興領域,您如何看待這個產業的發展現狀,我們處于什么階段?
預計兩到三年,生物醫藥會迎來“ChatGPT”時刻。
網易科技重磅推出系列對話欄目《態度AGI》。過去三年,AI變革風起云涌,全球科技秩序正在重構,通往AGI的道路或許正在悄然臨近。本欄目以AGI為題,將對話100位AI專家、企業家、投資人,試圖撥開云霧,與大家一道見證AGI時代的到來。
第十七期對話清華大學國強教授、
AIR首席研究員、水木分子首席科學家聶再清。
內容聲明:1、本站收錄的內容來源于大數據收集,版權歸原網站所有!
2、本站收錄的內容若侵害到您的利益,請聯系我們進行刪除處理!
3、本站不接受違規信息,如您發現違規內容,請聯系我們進行清除處理!
4、本文地址:http://www.lianouzz.com/zuixinwz/145.html,復制請保留版權鏈接!
中國工程院院士劉韻潔:5G時代將誕生規模更大的“BAT”,劉韻潔,bat,中國工程院院士,互聯網,院士
互聯網資訊 2025-04-18 20:20:27
智見丨專訪周鴻祎:頭部公司才做大模型大部分人得專注場景,周鴻祎,人工智能,微軟,大數據,史蒂夫·喬布斯,深度學習
互聯網資訊 2025-04-18 20:19:49
中國人要在太空安家!今天先把大廳送了上去,航天器,航天員,載人飛船,貨運飛船,宇航員,航天工程
互聯網資訊 2025-04-18 20:19:27
“月宮一號”總設計師劉紅:下一步,我們去外太空,劉紅,外太空,nasa,火星,網易科技
互聯網資訊 2025-04-18 20:19:25
專訪中國航天基金會理事長吳志堅:中國商業航天發展六大問題待解,吳志堅,航天,商業航天,錢學森,中國
互聯網資訊 2025-04-18 20:19:22
又一富豪上太空世界首富貝索斯圓了5歲的夢想,貝索斯,宇航員,布蘭森,謝潑德,馬斯克
互聯網資訊 2025-04-18 20:19:16
中國科學院院士王赤:中國空間科學投入僅NASA的五十分之一,目標是2049年接近,王赤,nasa,衛星,中國科學院院士,引力波,太陽系
互聯網資訊 2025-04-18 20:19:06
SpaceX星艦首飛爆炸馬斯克放出最貴煙花,spacex星艦,spacex,spacex公司,火星,星艦,航天器
互聯網資訊 2025-04-18 20:18:42
潮頭|三次加倉、回報45億!天圖投資潘攀:奈雪的茶會成為千億級公司,潘攀,潮頭,趙林,奈雪
互聯網資訊 2025-04-18 20:18:21
潮頭|梁建章:放下包袱,我更新我,梁建章,攜程,鄉村旅游,在線旅游,民宿,旅游業
互聯網資訊 2025-04-18 20:18:19
英諾天使基金合伙人王晟:風投“船票之戰”劍指大模型,王晟,大模型,潮頭,王小川,王慧文,英諾
互聯網資訊 2025-04-18 20:17:57
motorazr40ultra體驗:精準取舍一款很純粹的豎向折疊屏產品,摩托羅拉,手機,ultra,像素
互聯網資訊 2025-04-18 20:12:06
小米14Pro體驗:首發驍龍8Gen3實力出眾,影像再升級,小米,驍龍,2k屏,os,澎湃OS,小米14pro,雷軍
互聯網資訊 2025-04-18 20:07:31
OPPOWatchX千帆蔚藍輕體驗:圓形表盤功能豐富,oppo,手機,watch,表盤,手表,腕表
互聯網資訊 2025-04-18 20:06:38
中國工程院院士杜祥琬:國家要挺起腰桿,總得有人甘于獻身,杜祥琬,朱光亞,鄧稼先,于敏,王淦昌
互聯網資訊 2025-04-18 20:04:15
郭光燦院士:要在量子爭霸中勝出,靠游擊戰是不行的,郭光燦,量子信息,量子計算,量子計算機,院士,中科院
互聯網資訊 2025-04-18 20:03:50
蘋果首款AI手機iPhone16來了但大規模換機潮要等下代?,iphone,手機,apple,蘋果,相機,新iphone
最新資訊 2025-04-18 20:00:55
對話聚云科技朱軍:幫企業成為應用生成式AI的“王者”,朱軍,云管理,云科技,知識庫,云技術
最新資訊 2025-04-18 19:59:47
14小時極限反轉特朗普拉了TikTok一把,tiktok,美國,特朗普,拜登,youtube,musical
最新資訊 2025-04-18 19:58:47
微信淘寶京東的“賽博送禮”,沒能復現“紅包大戰”名場面,紅包,微信,淘寶,支付寶,京東,禮券
最新資訊 2025-04-18 19:58:27
對話許四清:DeepSeek把行業進入門檻砸到了地板上,許四清,deepseek,天使投資,風險投資,創業者,創業
最新資訊 2025-04-18 19:58:21
英偉達最新財報回擊“DeepSeek焦慮”|態度,英偉達,deepseek,態度,黃仁勛,財季,芯片
最新資訊 2025-04-18 19:58:13
2025MWC看點:5G-A、AI挑大梁6G已來中國科技軍團集體“秀肌肉”,手機,人工智能,華為,mwc
最新資訊 2025-04-18 19:58:02
對話楓清科技創始人高雪峰:企業對AI的態度正更加務實,高雪峰,人工智能,楓清,智能化,智能體
最新資訊 2025-04-18 19:57:34
智能汽車“智駕”事故頻發,誰該為此負責?,智駕,自動駕駛,駕駛員,汽車,自動駕駛技術,方向盤
最新資訊 2025-04-18 19:57:24
OpenAI放大招!GPT-4.1上線,編程戰力全開,openai,編程,人工智能,谷歌,應用程序,gpt
最新資訊 2025-04-18 19:56:02
CEO錦囊·出海季|流量更貴了,海外社媒如何“種草”?,流量,社媒,用戶群,出海季,ceo錦囊
最新資訊 2025-04-18 19:53:04