搜索:  
浙江大学计剑教授、张鹏研究员团队 Nat. Comput. Sci.:让AI读懂高分子结构 - 实现更精准的高分子材料性质预测
2025-11-26  来源:高分子科技

  人工智能(AI)因其强大的建模复杂非线性关系的能力,正在重塑化学研究,尤其在生物化学、有机化学和无机化学等领域,已取得了重大的突破。然而,在高分子科学中,这一浪潮却未能充分释放潜力。为什么?一方面,相较于其他领域,高分子科学所积累的数据通常极为稀缺且碎片化,这对构建具有泛化能力的模型提出了严峻挑战。另一方面,高分子本身结构复杂,具有长链与周期性等特征,在现有的AI建模中,往往被简化为单一重复单元,采用类似小分子的处理方式。这种简化忽略了其结构本质,导致模型难以真正理解高分子,限制了实际应用效果。此外,高分子材料的性质不仅取决于其重复单元的化学结构,还与分子量及其分布、交联程度、共聚方式,甚至加工条件等因素密切相关。因此,要想让AI真正服务于高分子材料设计,迫切需要一个统一的表示学习框架,能够显式建模其长程结构,并灵活地整合额外信息,以适应多样化的下游任务。


  为此,浙江大学高分子科学与工程学系计剑教授、张鹏研究员团队开发了一种周期性感知的高分子深度学习框架(PerioGT),用于高分子的表征学习与性质预测。该模型通过结构感知的自监督预训练,在海量无标签数据中学习高分子的结构先验,并在16个高分子性质预测任务中全面超越现有的AI模型。值得一提的是,PerioGT 采用了模块化图构建策略,具备良好的可扩展性,适用于各类高分子材料体系。同时,作者还通过一个真实案例对其在材料筛选中的实际效能进行了验证。


  2025年11月20日,相关成果以“Periodicity-aware deep learning for polymers”为题发表于《Nature Computational Science》,吴宇晖博士研究生为论文第一作者。


  首先,研究团队引入了一种化学知识驱动的周期性先验。具体做法是,在高分子主链上设置固定大小的采样窗口,通过滑动提取多个结构片段。来自同一高分子的不同片段被视为正样本对,不同高分子的片段则作为负样本对,并在片段中随机掩盖部分原子。在此基础上,研究者构建了对比学习任务,显式引导模型识别语义上相似的结构片段,从而更准确地捕捉高分子的长程周期性规律。同时,模型还学习如何根据上下文重建被掩盖的原子信息,增强其对局部结构的理解能力。基于这一思路,作者在100万个虚拟高分子结构上进行了大规模自监督预训练,使模型能够全面学习高分子的通用结构特征。同时,为了构建一个灵活、统一的框架,作者还提出了一种模块化的图构建策略(PolymerGraph),通过虚拟节点的形式引入额外的全局/局部信息,从而促进关系建模,灵活地适应各类高分子材料体系(包括各类共聚物)。此外,团队还提出了一种周期性增强的提示调优策略(PGFT),将不同片段中的等价信息融合,使模型在微调时能更好地利用预训练中学到的知识。



1 模型概况。a, 预训练过程。b, 基于周期性增强的对比学习。c, 模块化的PolymerGraph构建策略。d, 周期性增强的提示调优。


  随后,研究团队系统评估了模型在10个均聚物性质预测任务中的表现,涵盖了高分子材料中的一系列关键性能指标。结果显示,PerioGT在所有任务上均显著优于现有模型。进一步地,研究者将模型应用于6个更具挑战性的共聚物预测任务,在结构更复杂、变量更丰富的场景下,PerioGT 依然展现出最佳性能。上述结果表明,作者提出的周期性感知的预训练策略不仅有效引导模型学习高分子丰富的结构特征,且具备跨体系、跨任务的广泛适用性。





  为了进一步验证模型对高分子周期性结构的感知能力,研究团队对模型生成的嵌入向量进行了相似性分析(图2)。结果显示,PerioGT 能够准确识别出高分子中的周期性结构模式,而传统方法则未能展现出明显规律,表明 PerioGT 对结构周期性的建模更为精准。进一步地,作者通过展示四组具体实例(图3),更直观地印证了 PerioGT 在捕捉周期性信息方面的优势。



2 PA-level相似性分析。



3 Instance-level相似性分析


  为进一步理解PerioGT优越性能背后的原因,研究团队对模型的潜在表示空间进行了深入分析。他们从三个维度展开评估:属性对齐、结构对齐与分布均匀性。结果显示,PerioGT的潜在空间不仅捕捉到了玻璃化转变温度(Tg)、熔点(Tm)等高分子的关键物化性质,还能有效区分结构相似的高分子类型,体现出对结构的强大表征能力。同时,模型生成的嵌入分布更加均匀,有助于保留更丰富的信息。这些结果表明,PerioGT在自督学习中成功提取了高分子的深层结构与性质规律,为多种下游任务提供了坚实的表征基础。



4 潜在空间分析。a,b, 属性对齐性可视化分析。c, 结构对齐性可视化分析。d, 均匀性可视化分析。


  最后,为了验证PerioGT在真实世界中的有效性,研究团队开展了一个关于抗菌聚合物发现的案例研究。作者通过Michael加成反应构建了一个虚拟高分子库,并从中合成了一部分样本进行实验标注。微调后,PerioGT 展现出优于其他模型的预测准确性。研究人员进一步筛选出模型预测排名前30的候选分子并实际合成测试,结果有高达 83%25/30)的高分子在体外表现出良好的抗菌活性,远超其他自监督学习模型(57%20%)。其中两种代表性高分子对耐甲氧西林金黄色葡萄球菌展现出强效抑菌能力(MIC = 8 μg/mL)。



扩展图1 案例研究:抗菌高分子。a, 基于Michael加成的高分子库。b, Top-30实验结果。c, 筛选到的两种抗菌高分子。d, 活死染色结果。e-f, 机制探究。


  综上所述,该研究表明,将高分子中普遍存在的周期性先验引入建模过程,结合模块化的图构建策略,有助于显著提升模型表征的泛化能力和适用性作为一种自监督学习框架,PerioGT能够充分利用海量无标签数据,有效捕捉高分子体系中的关键结构语义,从而减轻对大规模标注数据的依赖,为高分子科学领域提供了一种通用且高效的建模范式。


  原文链接:https://www.nature.com/articles/s43588-025-00903-9

版权与免责声明:中国聚合物网原创文章。刊物或媒体如需转载,请联系邮箱:info@polymer.cn,并请注明出处。
(责任编辑:xu)
】【打印】【关闭

诚邀关注高分子科技

更多>>最新资讯
更多>>科教新闻