测试AlphaFold2在预测蛋白质结构方面的准确性极限

  • 发布时间:2023-11-23 11:04:39 来源:
标签:
导读 蛋白质是生物学的主力,由DNA序列编码,负责细胞内的重要功能。自从JohnKendrew在20世纪50年代首次对蛋白质结构进行实验测量以来,蛋白质折

蛋白质是生物学的主力,由DNA序列编码,负责细胞内的重要功能。自从JohnKendrew在20世纪50年代首次对蛋白质结构进行实验测量以来,蛋白质折叠成复杂三维结构的能力长期以来一直是科学界着迷和重要的课题。然而,几十年来,通过实验确定这些结构仍然是一项艰巨的挑战。

IBS研究员JohnM.McBride表示,“对DNA进行测序是一个比分析蛋白质结构简单得多的过程。例如,让我们比较一下DNA和蛋白质的研究进展。到目前为止,我们已经对数亿个DNA序列进行了测序,而在另一方面,我们只成功地表征了数十万个蛋白质结构。”

因此,计算生物学的一个中心焦点是根据序列预测蛋白质结构。了解蛋白质的结构对于破译其功能、深入研究疾病、揭示衰老以及为各种技术应用设计蛋白质至关重要。

谷歌DeepMind将人工智能的应用扩展到生物物理学领域。该公司的AlphaFold2代表了解决蛋白质结构预测问题的最新里程碑,缩小了计算预测与实验准确性之间的差距。这一成就足以让一些人宣称蛋白质结构预测的问题“已解决”。

但问题是:它的准确性如何?

尽管AlphaFold2在预测蛋白质结构方面取得了成功,但其准确性的局限性仍然存在问题。当试图预测蛋白质中最微小变化的影响时,就会出现一个基本问题——例如,在单点突变中,单个氨基酸被另一种不同化学性质的氨基酸取代。达到这个水平的准确性对于研究疾病和进化至关重要。

人们对AlphaFold2能否达到这样的精度表示怀疑。官方的AlphaFold数据库明确指出,“AlphaFold尚未经过验证可以预测突变的影响。特别是,考虑到包含不稳定点突变的序列,AlphaFold预计不会产生未折叠的蛋白质结构。”此外,最近的一些评估未能提供AlphaFold可以预测突变效应的证据。

基础科学研究所(韩国)软物质和生命物质中心的研究人员最近探索了AlphaFold2AI预测蛋白质结构能力的局限性。该团队使用双管齐下的方法提供了令人信服的、全面的证明,证明AlphaFold确实可以预测突变效应。首先,他们通过与实验结构进行比较来直接验证AlphaFold的预测。研究人员将其与AlphaFold预测的间接验证相结合,将AlphaFold预测的突变对结构的影响与蛋白质表型的经验测量进行比较。

图2.显示了蓝色荧光蛋白的结构,根据每个残基的应变与荧光的相关程度进行着色。与发色团结合的色氨酸残基(Y65)的原子以球体显示。该残基SY65的变形以两步方式导致荧光减弱。图片来源:《物理评论快报》(2023)。DOI:10.1103/PhysRevLett.131.218401

然而,整个过程非常具有挑战性。

第一个主要障碍是可用于比较的数据非常少。尽管公共蛋白质数据库(PDB)中有超过50万个结构,但其中只有一小部分可用于测量突变效应。经过严格的数据选择和控制各种因素后,研究人员只剩下几千种蛋白质,其实验结构涉及微小的氨基酸变化。这些数据还包含大量随机噪声,这使得区分由测量误差引起的结构变化和由突变引起的结构变化变得具有挑战性。

尽管如此,研究人员证明,可以使用实验结构对突变效应进行统计测量,从而为量化这些效应提供了可靠的方法。通过应用这种方法,研究人员证明AlphaFold的预测几乎与实验测量一样准确。

第二个挑战涉及典型的结构相似性测量不足以捕获由于突变引起的结构差异。均方根偏差(RMSD)等传统测量主要考虑整个蛋白质结构的变化,掩盖了突变区域的微小局部影响。局部距离差异测试(LDDT)等局部测量的分辨率也较低,捕捉细微差异的能力也受到限制。

作为回应,研究小组采用了物理学工具,特别是连续介质力学的概念,来测量蛋白质的应变,这是变形的自然测量方法。他们在几种荧光蛋白的荧光测量中测试了这种方法。研究发现,AlphaFold可以准确预测发色团结合位点的变形(这对荧光很重要),从而准确预测荧光蛋白中的荧光。

AlphaFold2发布两年后,我们仍在探索这种奇妙的新算法的局限性和陷阱。AlphaFold首次成功验证了预测突变效应,为疾病研究和药物开发铺平了道路,从而改善人类健康。预测突变效应的能力将增强进化研究,既向前看(利用定向进化来开发新酶),又向后看(了解生命本身的进化历史)。蛋白质科学的未来确实是光明的。

  • 免责声明:本文由用户上传,如有侵权请联系删除!