PNAS | 周界文和袁钧瑛团队合作开发原子互作生成模型Void-X用于蛋白质界面设计
精准预测蛋白质-蛋白质/药物在原子层面的相互作用,并通过蛋白质设计技术精确调控这些根本的相互作用,在加速疗法开发和解决未满足的医疗需求方面具有巨大的潜力。随着腺相关病毒(AAV)和mRNA脂质纳米颗粒(LNP)等蛋白质递送技术的快速发展,以组织特异性的方式递送设计的胞内或胞外蛋白质已日益可行。
尽管以Transformer和Diffusion模型为代表的生成式AI框架,已加速了针对特定结构表位的从头蛋白质设计,但当前大多数方法仍遵循一种自上而下(top-down)的策略:首先生成一个能够适配目标位点的整体蛋白质骨架,随后再设计蛋白质序列以优化结合能力。
2026年6月9日,中国科学院上海有机化学研究所生物与化学交叉研究中心周界文与袁钧瑛团队在Proceedings of the National Academy of Sciences (PNAS)上发表了题为“Void-X: A generative void-filling model for predicting atomic packing in proteins”的研究论文,开发了原子互作生成模型Void-X,一种采用自下而上(bottom-up)的范式设计蛋白质界面。与现有方法先设计整体蛋白质形状不同,Void-X能够针对特定结构区域直接生成与之匹配的互作原子分布,从而为蛋白质-蛋白质界面设计奠定了物理可解释的基础。

Void-X作为一种原子填充模型,旨在捕捉原子尺度的相互作用模式,并填补蛋白质界面中的原子空位(图1)。为了训练该模型,研究团队从蛋白质数据库(PDB)中精心筛选并构建了超过800万个球形原子簇。在每个原子簇中,约30%位于外围且空间中连续的原子被掩码以待生成,其余原子则作为上下文信息。Void-X模型拥有1.7亿个参数,在蛋白质链内原子簇预测任务中的准确率达到78.3%,在蛋白质链间原子簇预测任务中的准确率为68.2%。

图1. Void-X原子填充模型训练流程图
凭借这些能力,Void-X能够直接生成原子级别的蛋白质相互作用,为蛋白质设计开辟了一条直观且全新的路径(图2)。该模型将原子层面的精细信息与生成模型融为一体,极大地丰富了生物分子界面的理性设计手段,在药物研发等领域拥有较大的应用潜力。

图2. Void-X生成的原子分布示例(低信息熵)。总体而言,这些局部结构包含多个氨基酸片段,且大多数氨基酸均呈现出完整的侧链结构。
中国科学院上海有机化学研究所生物与化学交叉研究中心袁钧瑛院士和周界文研究员为本文的通讯作者,杨静副研究员为第一作者。以上工作得到了国家自然科学基金委、中国科学院、上海市科委的大力资助和支持。
原文链接:https://www.pnas.org/doi/10.1073/pnas.2607035123
附件下载: