AI解半世纪难题 解构蛋白质助研新药

发布 : 2020-12-02  来源 : 明报新闻网


用微信扫描二维码,分享至好友和朋友圈
美国科网巨擘Alphabet旗下的人工智能(AI)研究公司DeepMind宣布,其最新系统「AlphaFold」成功预测多款蛋白质结构,破解半世纪以来的生物学难题。以往要识别单一蛋白质的结构,通常需数年的实验室研究,但AlphaFold可于数天内就得出准确结果。这项突破预料可加快多种疾病的研究,包括新型冠状病毒,亦有助设计新药、更具营养的农作物、以至可用于分解废物的žJ。

组成蛋白质的氨基酸链可以多种方式摺叠成3D形状,而形状就决定了不同蛋白质的功能。大多数生物过程都围绕蛋白质,如胰岛素如何控制血糖水平,以至抗体如何对抗新冠病毒等都取决于蛋白质结构。过去50年,预测蛋白质结构是生物学的重大挑战。美国科学家安芬森(Christian Anfinsen)在1972年获诺贝尔化学奖的研究表明,理论上可按蛋白质的氨基酸序列判断其结构。不过,蛋白质的摺叠方式是天文数字(1后300个0),而科学家现识别出逾2亿种蛋白质,但只知道少数蛋白质的结构。研究人员传统透过精密的实验解构蛋白质形状,通常需时数年才能拆解到一款蛋白质的结构。

训练数周 准确度达实验室水平

DeepMind的团队利用一个有17万种蛋白质序列及形状的公开数据库,让AlphaFold学习蛋白质如何摺叠,训练持续数周。研究人员其后让AlphaFold参加两年一度、俗称「蛋白质奥林匹克」的蛋白质结构预测技术关键测试(CASP)。参赛者会获得约100种蛋白质的氨基酸序列,然后利用电脑预测其形状,再跟实验得出的结果比较。评分为0至100分,90分代表准确度相当于实验室水平。结果,AlphaFold不仅胜过其他电脑程式,其得分中位数更达92.5分,即使是最困难的蛋白质项目亦有87分。

DeepMind表示已开始与数个科学团体合作,初步将聚焦疟疾、渴睡症和利什曼病(Leishmaniasis)。其创办人哈萨比斯(Demis Hassabis)形容是激动人心的时刻,「这些演算已变得足够成熟和强大,可应用于真正具有挑战的科学问题上」。英国皇家学会会长拉马克里希南(Venki Ramakrishnan)亦称这是「令人震惊的进步」,因为该研究领域许多人都以为要数十年后才能达到这地步。

本身是英国公司的DeepMind在2014年被Google收购,翌年归入Google母公司Alphabet旗下,以设计在多款游戏击败真人的AI程式闻名,例如在2017年击败世界围棋冠军柯洁的AlphaGo。不过游戏并非其开发程式的目标,而是为程式提供训练,目标是用于解决现实世界的问题。(卫报/金融时报/BBC)