方案详情
正文:
蛋白质设计是一项艰巨的任务,就像在堆积如山的干草中寻找一根针一样困难。干草代表着可能的蛋白质设计的巨大搜索空间,每一根干草条都对应着一种独特的氨基酸组合和结构排列。而那根针则代表着能够发挥作用的特定设计——一种具有高亲和力、正确折叠并且具备预期生物功能的设计。有 20 种标准氨基酸以及无数可能的组合,干草的空间极其庞大,而那根针则微不足道。但如果我们能够使用一种强大的工具来引导我们的搜索,专注于干草堆中最有希望的区域并缩小可能性范围,那该怎么办呢?这就是 RF扩散算法发挥作用的地方,它是一种前沿的生成式人工智能算法,正在彻底改变蛋白质设计领域。
蛋白质之间的相互作用对于几乎所有的生物过程都至关重要,从控制细胞生长、分化和凋亡的信号通路,到代谢和调节免疫反应,以及许多其他至关重要的功能。蛋白质-蛋白质相互作用所具有的多方面作用使其成为潜在药物靶点的重要来源,提供了新的作用机制,正吸引着人们的极大关注。理解这些相互作用并设计蛋白质结合剂的能力不仅限于药物治疗的发现。
在研究和工业应用中,结合蛋白可以作为体外和成像诊断、生物传感和生物催化的有用工具。设计蛋白质结合剂的目标是发现或优化具有特定结合能力的蛋白质序列,通常是为了改进现有的相互作用或创造全新的相互作用。但问题在于,设计空间极其庞大,大多数设计在感兴趣的生物环境(生物体、温度、pH值)中都缺乏所需的功能,或者无法形成所需的构象。在最近的人工智能模型和相关发展出现之前,蛋白质结合剂的设计是一个更具挑战性、耗时且往往更难以预测的过程。
科学家们主要依靠多种实验技术、计算方法(如基于结构的设计、同源建模和对接技术,或者专注于框架区域和特定环结构域的抗体建模工具)以及进化方法来进行研究。在过去十年中,随着大卫·贝克教授的工作以及 2023 年《RF扩散》(一种“用于蛋白质设计的通用深度学习框架”)的发表,这一情况发生了变化。该框架的重要性因2024年诺贝尔化学奖授予贝克教授(因其在计算蛋白质设计方面的工作)而得到了进一步确认。该奖项还与谷歌深蓝公司的德米斯·哈萨比斯和约翰·詹珀共同分享,以表彰他们在蛋白质结构预测方面的工作。
用人工智能生成蛋白质结合物:射频扩散
其核心在于,RF扩散技术采用了先进的生成式人工智能方法。想象一下,我们并非从已定义的蛋白质开始,而是从一团分散的原子坐标云状结构——本质上就是结构上的“噪声”开始。然后,算法通过一系列迭代步骤对这一初始状态进行细致的“去噪”处理。在每一步中,它都会优化这些原子的位置,引导它们形成一个连贯、稳定且符合生物学可行性的蛋白质结构。这个过程就像雕刻家从一块粗糙的石块中逐渐展现出一个精细的图形,或者摄影师将模糊的照片调整为清晰、锐利的图像,每一次的改进都能使最终的预期设计变得更加清晰明确。这种强大的生成能力为解决一系列生物治疗设计难题打开了大门。例如,RF扩散可以用于设计新型生物制剂,使其能够与病毒靶标结合并进行中和。在蛋白质-蛋白质相互作用领域,无论是涉及抗体还是其他系统,它都能生成新的结构支架,旨在优化结合亲和力或增强复合物的稳定性。此外,该算法在设计基于酶的疗法方面也展现出巨大潜力,例如那些能够分解特定代谢物以治疗代谢疾病的疗法。其应用范围不仅限于医学领域。RF扩散在定制设计蛋白质方面具有巨大潜力,可用于工业和生物技术领域,从开发能以高精度驱动特定化学反应的酶,到开发能在各种温度或 pH 值等极端环境条件下保持功能的蛋白质。
RF扩散于 2024 年通过 BIOVIA Discovery Studio Simulation 的“生成蛋白质支架”协议在 3DEXPERIENCE® 云中向用户开放。这一实施为用户提供了一个强大的基于人工智能的蛋白质设计工具,使他们能够访问该算法并解决各种蛋白质设计问题,包括酶活性位点支架设计、对称模体支架设计、寡聚体设计和蛋白质结合体设计。“生成蛋白质支架”协议的最新版本显著增强了蛋白质结合体设计能力,使用户能够轻松定义目标蛋白质上的特定“热点”,新支架必须与这些热点相结合。
通过明确这些关键残基——即已知或预测对相互作用至关重要的区域——用户能够引导 RF扩散算法将其生成能力集中于设计出能与目标区域实现有意义结合的结合剂。这种有针对性的方法极大地提高了生成具有高亲和力和特异性的结合剂的可能性,同时还能通过将搜索集中于蛋白质-蛋白质界面中最有可能的区域来节省计算资源。
蛋白质结合剂的多步骤人工智能工作流程
从概念到具有潜力的候选物这一过程包含多个关键的基于人工智能的步骤。首先,生成蛋白质支架利用 RF扩散技术创建创新的三维支架。这些结构蓝图随后被传递给生成蛋白质序列的协议。
借助像 ProteinMPNN 这样复杂的模型,该协议根据设计的形状预测最优的氨基酸序列——即“线上的珠子”——旨在正确折叠并表现出预期的结合功能。至关重要的是,为了验证这些新颖的序列,它们随后被输入到预测蛋白质结构的协议中。这一步骤利用像OpenFold和 AlphaFold2 这样的前沿方法,通过计算来预测新设计的氨基酸序列将采取的三维结构。这提供了必要的计算机模拟验证,确认设计的序列确实有可能采用预期的折叠并与目标界面结合。这种全面的、多步骤的人工智能工作流程——从通过RFdiffusion 进行初始框架生成,到使用 ProteinMPNN 进行序列设计,再到使用像 AlphaFold2 这样的模型进行结构验证——将蛋白质结合剂设计这一复杂的挑战转化为对研究人员而言更为易于处理和高效的任务,最终加速了生物技术的发展直至达到实验验证阶段。
激发创新:生成式人工智能助力蛋白质结合剂设计的未来
生物泰克药物设计工具集中的“BIOVIA DISCOVERY STUDIO SIMULATION”部分包含了越来越多强大的人工智能工具,旨在为分子建模者和生物学家提供帮助,以协助他们设计出有效的蛋白质结合剂。此外,我们还特别注重这些工具的用户体验,以使它们更易于使用且操作更简便,以满足我们的用户需求。这一理念将在未来的发展中继续贯彻,从而创建出与现有基于物理的方法相结合的工作流程,使用户能够在计算机模拟中迅速探索更多的可能性,最终找到最理想的候选方案,这些方案有望成为成功的商业生物疗法或生物制剂,用于诊断、生物传感和生物催化等领域。
公司简介
北京泰科博思科技有限公司(Beijing Tech-Box S&T Co. Ltd.)成立于2007年,是国内领先的分子模拟及虚拟仿真综合解决方案提供商。
北京泰科博思科技有限公司与国际领先的模拟软件厂商、开发团队深入合作,为高校、科研院所和企业在材料、化工、药物、生命科学、环境、人工智能及数据挖掘、虚拟仿真教学等领域提供专业的整体解决方案。用户根据需要在我们的平台上高效的进行各种模拟实验,指导实际的生产设计。
北京泰科博思科技有限公司拥有一支一流的技术服务团队和资深的专家咨询团队,以客户真正需求出发,服务客户,为客户创造价值。我们秉承“职业、敬业、担当、拼搏、合作”的企业精神,致力于用国际领先的软件产品和专业全面的技术支持服务,成为客户可信赖的合作伙伴。
相关产品
联系方式
公司地址:北京市朝阳区安慧里四区15号
中国五矿大厦419室
电话:010-64951848
传真:010-58603969
销售部:sales@tech-box.com.cn
泰科博思二维码