新創公司 Evozyne 使用 NVIDIA 預先訓練好的人工智慧(AI)模型,創造出在醫療照護與潔淨能源方面皆有大好發展潛力的兩種蛋白質。在今(13)日發表的一篇合著論文中,描述該過程及其產生的生物構成原料。一個旨在治療先天性疾病,另一個則是用於消耗二氧化碳以減緩全球暖化。這些初步成果展現出科學家們找到一種能夠加快開發藥物及進行其他研發的新方法。
|
Evozyne 的 ProT-VAE 流程使用 NVIDIA BioNeMo 中Transformer 模型來生成用於藥物開發和能源永續的有用蛋白質。 |
Evozyne 公司共同創辦人、也是參與該合著論文的 Andrew Ferguson 表示:「即使首次研發,AI 模型同樣能產生跟天然蛋白質一樣優質的合成蛋白質,這不僅鼓舞了我們團隊的士氣,也讓我們知道這個模型正確地學習了大自然的設計規則。」
Evozyne 使用 NVIDIA 的 ProtT5 執行整個專案。ProtT5 是 NVIDIA BioNeMo 裡的部分 Transformer 模型,用於協助醫療照護領域建立AI 模型的軟體架構與服務。
跨足化學與機器學習領域的分子工程師 Ferguson 表示:「BioNeMo 的確提供我們進行模型訓練所需的一切,並以非常低的成本在模型上運行各項作業,我們可以在短短幾秒鐘內生成數百萬個序列組合。」
該模型是 Evovyne 旗下名為 ProT-VAE 的工作流程核心,可將 BioNeMo 與充當篩檢器的變分自動編碼器結合。
NVIDIA 的 Transformer 模型讀取蛋白質中的數百萬種氨基酸序列的技術類似閱讀,都是使用神經網路來理解文字的意涵。藉由此方式能夠進一步了解與掌握大自然如何組成這些強大生物。然後,該模型能夠接著預測要如何配合 Evozyne,進而找出解決的功能以生成新的蛋白質。
機器學習有助於一一排查可以使用的海量蛋白質序列,並有效地識別出最有用的序列。傳統的蛋白質生成方式稱為定向進化,用的是一種碰運氣的緩慢方法,且通常一次只能改變幾個氨基酸的序列。相較之下,Evozyne 的方法可以在同一輪中改變蛋白質裡半數以上的氨基酸。這相當於進行了數百次突變。Evozyne 打算使用這個新進展來生成一系列的蛋白質,用來對抗疾病和氣候變遷。
Evozyne 的資料科學家 Joshua Moller 說道:「他們運用多個 GPU 進行訓練及加速處理龐大的作業流程。我們現在每一分鐘,都能夠處理完一整個資料庫的資料。」這將訓練大型 AI 模型的時間,從幾個月縮減至短短一週。
Ferguson也指出最近擴散模型的崛起。AI 加速推動蛋白質生成的未來發展精彩可期。