2020 年世界十大科技進(jìn)展新聞 |
|
人工智能首次成功解析蛋白質(zhì)結(jié)構(gòu) |
|
圖中藍(lán)色為計算機(jī)預(yù)測的蛋白質(zhì)結(jié)構(gòu),綠
色為實驗驗證結(jié)果,二者相似度非常高。
生物學(xué)界最大的挑戰(zhàn)之一——蛋白質(zhì)三維結(jié)構(gòu)解析如今有望被破解。谷歌旗下人工智能公司DeepMind開發(fā)的深度學(xué)習(xí)程序AlphaFold能夠精確預(yù)測其三維形狀。
蛋白質(zhì)是生命活動的主要承擔(dān)者,其工作方式和作用取決于它的高級結(jié)構(gòu),即“結(jié)構(gòu)即功能”,它傾向于僅在受物理定律的指導(dǎo)下形成相應(yīng)結(jié)構(gòu)。
幾十年來,實驗室一直是解析蛋白質(zhì)結(jié)構(gòu)的主要途徑。從20世紀(jì)50年代開始,利用X單晶衍射法首次確定了蛋白質(zhì)的完整結(jié)構(gòu)。在過去的十年中,冷凍電鏡已經(jīng)成為許多結(jié)構(gòu)生物學(xué)實驗室所青睞的技術(shù)。
長期以來,科學(xué)家們一直想知道一級的氨基酸序列是如何折疊成各種構(gòu)型的蛋白質(zhì)三級結(jié)構(gòu)。在20世紀(jì)80年代和90年代,就有利用計算機(jī)預(yù)測蛋白質(zhì)結(jié)構(gòu)的嘗試,但是最終結(jié)果都不理想。
2020年11月30日,在蛋白質(zhì)預(yù)測結(jié)構(gòu)挑戰(zhàn)賽CASP上,英國DeepMind公司研究人員創(chuàng)建的AlphaFold程序在百余支隊伍中脫穎而出。AlphaFold程序在比賽中的中位分?jǐn)?shù)達(dá)92.4(滿分100分,90分以上被認(rèn)為預(yù)測方法可與實驗方法相媲美),預(yù)測最具挑戰(zhàn)性的蛋白質(zhì)結(jié)構(gòu)的平均得分為87,比最接近它的競爭對手領(lǐng)先了25分。
將深度學(xué)習(xí)與張力控制算法結(jié)合,并應(yīng)用于結(jié)構(gòu)和遺傳數(shù)據(jù),該深度學(xué)習(xí)網(wǎng)絡(luò)利用目前已知的17萬種解析完畢的蛋白質(zhì)進(jìn)行了訓(xùn)練,F(xiàn)階段AlphaFold系統(tǒng)可能需要幾天的時間才能得出預(yù)測的結(jié)構(gòu),其中包括對蛋白質(zhì)不同區(qū)域可靠性的評估。DeepMind有關(guān)研發(fā)團(tuán)隊表示,還將繼續(xù)對AlphaFold展開訓(xùn)練,以便更好地解析更復(fù)雜的蛋白質(zhì)結(jié)構(gòu)。
AlphaFold目前雖不太可能取代冷凍電鏡等相關(guān)解析蛋白結(jié)構(gòu)的實驗手段,但它的出現(xiàn)意味著,生物學(xué)家們可以將計算方法預(yù)測蛋白結(jié)構(gòu)作為科學(xué)研究的工具之一。另外,在現(xiàn)有的繁雜的基因組數(shù)據(jù)中,新一代分子生物學(xué)家如何針對數(shù)據(jù)轉(zhuǎn)換為蛋白結(jié)構(gòu)解析提供幫助,是AI技術(shù)在結(jié)構(gòu)生物學(xué)發(fā)展中的難題!
《科學(xué)新聞》 (科學(xué)新聞2021年2月增刊 聚焦)