來自普林斯頓工程和羅格斯大學的研究人員找到了穩(wěn)定蛋白質(zhì)的方法,。該團隊的機器人平臺將速度提高了10倍以上,,他們的計算方法找到解決方案的速度,,比單獨依靠人類智能可能的速度快幾周到幾年,。
穩(wěn)定蛋白質(zhì)是藥物研發(fā)、生物燃料生產(chǎn)和塑料回收研究的核心挑戰(zhàn),。目前,,科學家利用他們的化學知識來估計在不同條件下哪些化合物會與蛋白質(zhì)很好地配對。傳統(tǒng)的方法使用試錯法來提煉結(jié)果,。這種艱苦的方法可能需要幾個月的時間,,因為科學家們創(chuàng)造和測試分子樣本,而且往往毫無結(jié)果,。
在新系統(tǒng)中,,工程師使用機器學習模型來識別化學化合物最有可能穩(wěn)定所需的蛋白質(zhì),。該模型有助于將數(shù)十萬種可能性縮小到幾個可能的候選人。一個機器人裝配平臺生產(chǎn)分子樣本用于評估,。將機器人平臺與機器學習模型幾天后就會有結(jié)果,。
這種雙渦輪增壓方法提供了一個額外的優(yōu)勢:由于它能夠處理大量數(shù)據(jù),機器學習模型經(jīng)常會推薦科學家不會想到的候選分子,。
利用機器學習來指導我們的搜索加速了發(fā)現(xiàn),,其數(shù)量很難量化,但非常重要,。
在韋伯和羅格斯大學生物醫(yī)學工程助理教授亞當·葛姆雷的帶領(lǐng)下,,研究人員在雜志上發(fā)表了他們的發(fā)現(xiàn)新材料.
在開發(fā)他們的系統(tǒng)時,,該團隊轉(zhuǎn)向了三種具有獨特屬性的蛋白質(zhì),包括在辣根中發(fā)現(xiàn)的一種蛋白質(zhì),,這種蛋白質(zhì)廣泛用于醫(yī)院和水處理廠,。
如果我們能夠解決這三種酶的問題,那么理論上可以將相同的程序擴展到所有種類的酶,。
雖然蛋白質(zhì)在自然界中表現(xiàn)出各種驚人的壯舉,,但它們往往對自己的工作條件很挑剔。溫度的變化或暴露在溶劑中會阻止它們前進,。為了使蛋白質(zhì)變硬,,以便在它們的自然環(huán)境之外使用,科學家們經(jīng)常用專門的支撐材料來加固它們,,如混凝土中的鋼筋,,使這些脆弱的結(jié)構(gòu)更加堅固。這是實現(xiàn)大量生物醫(yī)學,、環(huán)境和其他工業(yè)技術(shù)的關(guān)鍵一步,。
但是找到蛋白質(zhì)和它的支持分子之間的完美匹配意味著優(yōu)化天文數(shù)字的選擇,。傳統(tǒng)的方法很慢,而且很不系統(tǒng)——試錯法——這意味著大多數(shù)可能的解決方案都沒有被探索過,。
研究人員首先基于傳統(tǒng)的直觀方法制作了500種不同的支持分子,。每一種支持物都有可能使蛋白質(zhì)抵抗惡劣的工業(yè)條件,但研究人員知道的不多,。然后,,他們測試了作為支持物的500個分子中的每一個,收集了關(guān)于其性能的真實數(shù)據(jù),,同時讓計算機模型預測他們會發(fā)現(xiàn)什么,。將預測與發(fā)現(xiàn)進行比較,使他們能夠通過稱為強化學習的積極強化過程來改進計算機模型,。
利用新訓練的計算機模型,,研究人員將搜索范圍擴大到50多萬種可能的支持分子。每個分子代表一種不同的配方,,由成千上萬種不同結(jié)構(gòu)的成分拼湊而成,。他們在模型中運行了四次數(shù)據(jù),,每次都在尋找兩件事:表現(xiàn)優(yōu)于該領(lǐng)域其他人的分子,,或者擁有一些有趣品質(zhì)的分子,這些品質(zhì)可能使算法更加復雜,。
與他們使用基于直覺的方法識別的分子相比,,新的機器輔助方法發(fā)現(xiàn)的支持分子對辣根蛋白的作用要好五倍以上。當使用脂肪酶(一種分解體內(nèi)脂肪的蛋白質(zhì))時,,結(jié)果要戲劇性得多,。新系統(tǒng)發(fā)現(xiàn)了一種支持分子,與最初的選擇相比,,它將性能提高了大約50倍,,甚至推動了蛋白質(zhì)在自然環(huán)境之外比在自然狀態(tài)下工作得更好。
他們可以通過整合機器學習模型現(xiàn)場的物理機器人系統(tǒng),。大部分初始工作是通過在兩個實驗室之間來回發(fā)送數(shù)據(jù)來完成的,。
該團隊正在著手開發(fā)的具體應用分子穩(wěn)定蛋白質(zhì)可能會帶來變革性的解決方案:一種回收難以破碎的塑料的新方法和一種非侵入性的脊髓損傷治療方法。