一项新的人工智能程序将帮助研究人员提高他们的药物研发力度。
该项目名为TopoFormer,由密歇根州立大学数学系研究基金会教授郭伟领导的跨学科团队开发。TopoFormer将分子的三维信息转化为典型的基于人工智能的药物相互作用模型可以使用的数据,从而扩展这些模型预测药物有效性的能力。
“有了人工智能,你可以让药物研发更快、更高效、更便宜,”魏先生说,他同时在生物化学和分子生物学系以及电气和计算机工程系任职。
魏先生和他的团队在《自然机器智能》杂志上发表了有关他们工作的论文。
结构说明
魏教授说,在美国,开发一种药物大约需要十年时间,耗资约20亿美元。他补充说,药物试验大约占了一半的时间,而另一半时间则用于发现新的治疗候选药物进行测试。
TopoFormer有可能缩短开发时间。这样一来,它就可以降低开发成本,从而降低下游消费者的药品价格。这对于罕见病尤其有用,因为患者数量有限意味着制药公司需要收取更多费用才能收回成本。
尽管研究人员目前使用计算机模型来辅助药物研发,但由于问题的变量众多,它仍然存在局限性。
“我们的身体中有超过20,000种蛋白质,”魏说。“当疾病出现时,其中的一些或某一种蛋白质就会成为目标。”
那么,第一步就是了解疾病会影响哪种或哪些蛋白质。这些蛋白质也成为研究人员的目标,他们希望找到可以预防、减轻或抵消疾病影响的分子。
魏教授说:“当我有一个目标时,我会尝试针对该特定目标寻找大量潜在药物。”
一旦科学家知道了药物应该针对哪些蛋白质,他们就可以将蛋白质和潜在药物的分子序列输入传统的计算机模型中。这些模型可以预测药物和靶标将如何相互作用,指导开发和在临床试验中测试哪些药物。
虽然这些模型可以仅根据药物和蛋白质的化学组成来预测一些相互作用,但它们也忽略了来自分子形状和三维或3D结构的重要相互作用。
20世纪60年代化学家发现的布洛芬就是一个例子。有两种不同的布洛芬分子,它们具有相同的化学序列,但3D结构略有不同。只有一种排列方式可以与疼痛相关蛋白质结合并消除头痛。
魏说:“目前的深度学习模型在预测药物或蛋白质如何协同作用时无法解释它们的形状。”
这就是TopoFormer的作用所在。它是一个变换模型,与OpenAI的聊天机器人ChatGPT使用的人工智能类型相同(GPT代表“生成式预训练变换器”)。
这意味着TopoFormer经过训练可以读取一种形式的信息并将其转换为另一种形式。在这种情况下,它会根据蛋白质和药物的形状获取有关它们如何相互作用的三维信息,并将其重建为当前模型可以理解的一维信息。
事实上,“Topo”代表“拓扑拉普拉斯”,这是魏教授和他的团队发明的用于将三维结构转换为一维序列的数学工具。
新模型经过数万种蛋白质-药物相互作用的训练,其中两种分子之间的每种相互作用都被记录为一段代码或一个“单词”。这些单词串在一起,形成对药物-蛋白质复合物的描述,从而记录其形状。
“这样一来,很多很多的单词就串联起来,就像一个句子了,”魏教授说道。
然后,其他预测新药相互作用的模型可以读取这些句子,并为其提供更多背景信息。如果新药是一本书,TopoFormer可以将一个粗略的故事构思变成一个完整的情节,随时可以动笔。