通过深度神经网络调优降低共聚物相容剂序列-性能预测的数据需求
合成序列可控聚合物有望通过结合合成聚合物的化学多样性与生物蛋白质的精确序列介导功能,彻底改变聚合物科学。然而,这些材料的设计被证明极具挑战性,因为它们缺乏加速蛋白质设计所需的大量密切相关演化分子数据集。
本文报告了一种新的人工智能策略,可显著减少加速这些材料设计所需的数据量。研究重点在于连接相容剂分子重复单元序列与其降低不同聚合物域间界面张力能力的数据。这些分子的最优序列强烈依赖于浓度和聚合物化学细节等变量,对于混合废弃聚合物回收等应用至关重要。采用现有方法,这需要在每个条件下都有完全不同的数据集来实现设计。
研究表明,在某一组条件下训练的低精度序列/界面张力关系深度神经网络,可以快速微调以在另一组条件下进行更高精度的预测,所需数据量远少于通常需求。这种"预训练-微调"方法允许单个低精度父数据集显著加速整个相关系统群的预测和设计。长远来看,它还可能提供一种方法,通过从快速粗粒度模拟中获得的人工智能见解,实现定量原子级设计。