7月21日,来自华盛顿大学等机构的科学家们在Science杂志上发布了一款新的人工智能(AI)软件,该软件能够为自然界中尚不存在的蛋白质绘制结构。
更令人振奋的是,科学家们已经利用这一软件创造出潜在用于工业反应、癌症治疗、甚至用于预防呼吸道合胞病毒(RSV)感染的候选疫苗的原始化合物。
来源:Science
(资料图片仅供参考)
计算生物学家Jue Wang和他的同事成功开发这一人工智能(AI)软件是基于一系列“利用计算机从氨基酸基础序列预测天然蛋白质3D结构”的最新进展。
去年,DeepMind开发的一款名为AlphaFold的人工智能(AI)程序,为几万种单体人类蛋白质预测了结构。此外,AlphaFold和名为RoseTTAFold的人工智能(AI)软件包也预测出了数千种蛋白-蛋白复合物的结构。基于这些里程碑成果,蛋白质结构预测软件被Science杂志评为” 2021年度突破(Science’s 2021 Breakthrough of the Year)。
预测天然蛋白质如何折叠是一回事;从头开始设计新的蛋白质则是另一回事。
2017年,由华盛顿大学蛋白质设计师David Baker领导的团队表明,他们能够使用之前开发的一款不涉及AI的蛋白质结构预测软件程序Rosetta来设计潜在的基于蛋白质的药物,这种药物可以结合流感病毒和细菌毒素的分子靶点并使其失活。
团队成员首先向软件输入他们想要的已知片段,即一小块被称为结合基序(binding motif)的蛋白质结构,它能够与目标结合。然后,他们让Rosetta扫描他们之前设计的蛋白质结构数据库,并找到一种现有的可能将活性位点保持在正确形状的骨架。然后软件将两部分组合在一起,并做出调整、改进。
尽管这一方法能够帮助药物研发,但是只有在Rosetta能够找到合适的骨架时才有效。“过去,我们只能被动地期望能筛出一个很好的匹配,但现在情况不相同了。” David Baker说。
David Baker、Jue Wang及他们的同事已经对AI驱动的RoseTTAfold进行了改造,以使用两种不同的策略从头开始设计自己的蛋白质。
第一种策略被称为“inpainting”,它的开始与之前类似,给人工智能(AI)一个起点,如一个活性位点或所需蛋白质的另一个关键特征。就像文字处理器的自动补全功能会在你输入几个字符后补全一个单词一样,人工智能(AI)会利用它对蛋白质折叠方式的理解,在中心特征周围填充蛋白质的其他部分。
第二种策略被称为“constrained hallucination”,相比第一种策略更加开放。它给软件提供了一个蛋白质的目标,比如与金属结合。然后,该程序生成一个由随机氨基酸序列组成的虚拟蛋白质,并反复改变该序列,评估每一个变化对蛋白质可能的形状和功能的影响。人工智能(AI)会保留它认为有效的部分,并突变其他部分,朝着目标稳步进化。
Design of protein-binding proteins(来源:Science)
在这两种情况下,最终预测的蛋白质都能够在实验室中制造并接受测试。可喜的是,两种策略都奏效了。David Baker和他的同事们制造出了能够结合癌细胞上受体、抓取溶液中金属以及结合二氧化碳的新型蛋白质。
最后,为了鉴定潜在的RSV疫苗,研究小组的人工智能(AI)产生了37种新型蛋白质,旨在将病毒的关键部分F蛋白位点V呈现给免疫系统。37种中有3种与已知的RSV中和抗体结合,表明它们可能有效。
尽管结果并不总是完美的,但通过想象不同的蛋白质,该软件提出了迄今为止在自然界中从未见过的结构。“研究者们可以以此为起点,在实验室中进化改进的蛋白质。” 参与该研究的Joe Watson说。
密歇根大学蛋白质设计师Yang Zhang表示:“这是对人工智能(AI)的完美利用。尽管研究人员使用计算机和其他手段设计新蛋白质已经有几十年了,但像这项新研究提出的人工智能(AI)方法很可能会增加成功率。”
作者:曼话,来源:医药魔方Pro,原文标题:《Science里程碑:AI成功设计自然界中尚不存在的蛋白,有望变革抗癌药、疫苗研发》。
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。