近日,中美兩國在人工智能驅動的生物學研究領域取得了重大突破,這一消息引起了全球科學界的廣泛關注。
美國科技巨頭NVIDIA攜手Arc研究所、斯坦福大學、加州大學伯克利分校及加州大學舊金山分校,共同推出了一款名為Evo2的開源AI生物模型。這款模型擁有驚人的400億參數,整合了來自128,000個物種的93萬億核苷酸數據。Evo2的問世,預示著其在分子研究、精準醫療、藥物研發及合成生物學等領域將發揮舉足輕重的作用。全球研究者現在可以通過網頁界面免費獲取Evo2的源代碼、訓練數據及參數。
與此同時,在中國,清華大學人工智能產業研究院(AIR)與北京水木分子聯合發布了BioMedGPT-R1的升級版,這是一款面向生物醫學的開源多模態AI模型。新版本在原有BioMedGPT模型的基礎上,融入了DeepSeek R1模型的精華。BioMedGPT-R1擁有170億參數,并在美國執業醫師資格考試(USMLE)中取得了67.1%的準確率,這一成績已接近人類專家的水平。
清華大學AIR由著名智能科學教授張亞勤創立,他同時也是中國工程院外籍院士。此次發布的BioMedGPT-R1,進一步彰顯了AIR在AI與生物醫學交叉領域的深厚實力。
NVIDIA首席執行官黃仁勛在2024年GTC大會上強調了AI在生物學研究中的重要性,將其視為AI發展的三大關鍵方向之一。他表示:“在人類歷史上,生物學首次有機會成為工程學,而不僅僅是科學?!边@一觀點得到了中國學者王建的呼應,他強調AI雖遠未解決所有科學問題,但其跨學科融合的能力有望引領科研革命。
Evo2由Arc研究所的生物工程師帕特里克·徐的團隊開發,能夠處理編碼和非編碼DNA,其應用范圍比早期的蛋白質預測模型如AlphaFold更為廣泛。Evo2能預測癌癥相關基因(如BRCA1)中的遺傳突變對人類健康的影響,其區分良性突變與有害突變的準確率超過90%。這將極大加速遺傳分析與藥物研發進程。
Evo2還能處理多基因結構及調控區域,整合基因組學、表觀基因組學、蛋白質組學及結構預測工具,成為遺傳研究中的多面手。Evo2在訓練數據中排除了病原體,以確保安全性和倫理性。該模型能夠設計基因修飾、識別突變,甚至創造全新的生物系統,預示著AI在生物技術創新中將發揮核心作用。
同一天,清華大學與水木分子推出了BioMedGPT-R1的升級版。這款擁有170億參數的模型,在生物醫學應用中展現了卓越的深度推理能力。其整合文本與生物數據的多模態分析能力,使其在藥物發現與醫療推理等任務中表現出色。BioMedGPT-R1在USMLE中的高準確率,使其躋身人類專家與商業模型之列。
BioMedGPT-R1能夠深入分析藥物分子并預測藥物靶點,成為藥物研發領域的寶貴工具。其在生物醫學問答任務中的優異表現,預示著AI將深刻改變醫療研究與診斷的方式。