Press "Enter" to skip to content

利用时空特征的机器学习模型,研究材料科学中常见的「刺激-响应」问题

作者/余松林

 

编辑/凯霞

 

材料的力学或功能特性内源于自身结构,外显于对刺激的响应,因此材料结构与「刺激-响应」过程的关系是材料结构设计和性能预测的基础,是材料科学领域永恒的主题。

 

深度学习(DL)方法因其在处理材料高度复杂的结构-性能关系方面的优越性,有望成为材料性能突破的新设计范式。然而,在大多数情况下,通过收集海量实验数据或开源理论数据库来支持训练具有足够预测精度的 DL 模型是不切实际的。

 

近期,中国工程物理研究院化工材料研究所芦艾团队及其合作者利用具有时空特征的人工神经网络研究了 3D 打印多孔硅橡胶复杂的应力应变行为。作者将 3D 打印多孔硅橡胶的非线性应力应变行为视为一个典型的「刺激-响应」过程,这种「刺激-响应」过程的输入(因)可以拆分为静态的空间结构(空间)与序列应变刺激信号(时间),而输出则为对应的序列应力(果),在此基础上作者提出了一种具有时空特征以及分层学习机制的 CBLSTM 模型,因更充分利用了数据时空信息的逻辑关系减少了对数据量的需求。

 

该模型在小实验数据集中实现了对不同结构及不同变形模式的 3D 打印多孔硅橡胶非线性应力-应变曲线的精准预测,并成功设计并通过 3D 打印实现了具有超长应力平台的多孔硅橡胶结构。同时,通过该模型对 3D 打印多孔硅橡胶在宽频范围内阻尼响应进行了高精度的预测,证明了该模型应用于「刺激-响应」过程的可迁移性。该模型有望成为在小型实验数据集上进行创新材料设计的有力工具,也可用于探索复杂工作条件下材料结构和性能的演化机制。

 

这一成果近期以「 Studying Complex Evolution of Hyperelastic Materials under External Field Stimuli using Artificial Neural Networks with Spatiotemporal Features in a Small-Scale Dataset 」为题发表在《 Advanced Materials 》( https://doi.org/10.1002/adma.202200908 )上。

 

 

多孔硅橡胶作为典型的超弹性材料,是一类在外加应变作用下具有复杂非线性应力响应的弹性体,但迄今适用于其多种变形模式和大变形范围的全本构关系仍然是固体力学领域需要解决的关键问题。3D 打印赋予了多孔硅橡胶更丰富的结构参数,为其应力-应变行为的设计带来了更多想象空间,也为突破传统本构关系的局限性提供了绝佳机会。但与此同时,其结构与性能之间更为复杂的关系也变得愈加难以求解。

 

机器学习是一种无需任何先验物理知识即可对数据之间复杂关系进行建模的有效手段,有望将其应用于该类材料结构与性能关系的求解,但以统计算法为核心的机器学习往往需要足够的数据量才能得到令人满意的精度,而昂贵的数据收集成本限制了机器学习实际应用于解决此类材料问题。

 

在这项工作中,研究人员以超弹性材料的非线性应力和应变行为为研究重点,以实现基于小样本空间的高精度 DL 预测模型。

 

实验流程以及描述符选取

 

作者首先构建了一个包含 483 个不同结构的 3D 打印多孔硅橡胶与其对应的应力应变性能的数据集,首先研究了结构描述符对预测精度的影响。

 

 

图1:通过机器学习预测材料的「刺激-响应」过程。

 

在小数据集中,合适的结构描述符是建立高精度预测模型的前提。因此,作者选取了三种不同维度的结构描述符,(i)密度,(ii)结构参数,(iii)空间坐标+线径。

 

实验结果表明,达到相同的模型精度,最简单的密度描述符所需要的数据量最多;此外随着描述符维度的增加,在相同尺度的数据集中模型精度并没有进一步提升。因此,描述符的维度和准确性应该适当平衡,低维、准确的描述符是机器学习基于小规模实验数据集建模的关键要求。

 

 

图 2:多孔硅橡胶三种结构描述符在不同尺度数据集中的表现。

 

CBLSTM 模型构建

 

在上述基础上,作者设计了具有时空特征及分层学习机制的 CBLSTM 模型用于多孔硅橡胶复杂本构关系求解。CBLSTM 模型由 4 个卷积层(CNN)与 2 个双向的长短期记忆网络(BLSTM)单元构成。其中,CNN 用于提取多孔硅橡胶静态的空间结构,BLSTM 用于提取外界施加的序列化刺激信号。由于是对整个「刺激-响应」过程的预测,最后的输出为 50 个应力值分别对应不同的应变。

 

 

图 3:具有时空特征以及分层学习机制的 CBLSTM 模型示意图。

 

与 CNN 与 BLSTM 算法的对比

 

作者用了三种不同的损失函数(MAE,MSE,Huber)评估了 CBLSTM,CNN,以及 BLSTM 模型在多孔硅橡胶应力应变预测任务中的表现。所有的模型皆经过详尽的消融实验确保模型的架构以及超参数的最优配置。

 

 

图 4:三种模型的预测误差对比。

 

 

图 5:仅具有时空特征的 CBLSTM-1 模型预测误差分析。

 

结果表明,在三种不同的评价指标下,拥有时空特征的 CBLSTM 模型比其余两种模型具有更高的预测精度。同时,作者进一步对比了分层学习机制对模型预测精度的影响。将静态的空间结构特征与动态序列化特征打包输入到 CBLSTM-1 模型中,结果表明,尽管与单独 CNN 与 BLSTM 相比,CBLSTM-1 拥有更高的精度,但低于时空特征分别输入的 CBLSTM 模型。因此,分层学习机制有助于降低模型对任务的理解难度,从而进一步提高了模型的预测精度。

 

「刺激-响应」过程的预测及其可迁移性

 

在对整个多孔硅橡胶应力应变过程预测中,CNN 模型凭借其优异的空间特征提取能力可以取得较好的精度,然而其预测结果呈现出锯齿形,原因在于该模型缺乏对刺激响应过程中相邻点之间逻辑关系的理解。BLSTM 模型可以洞察相邻点之间的联系,从而使预测曲线平滑,但其弱的空间特征提取能力限制了其在复杂应力应变性能预测中的表现。

 

CBLSTM 模型完美继承了 CNN 与 BLSTM 模型的优点,其不仅拥有强大的空间特征提取能力同时可以洞察预测点之间的逻辑关系,在整个应力应变过程中拥有更优异的表现。

 

 

图 6:三种模型对多孔硅橡胶整个应力应变过程的预测对比。

 

同时,为了验证 CBLSTM 可以广泛用于材料科学中的刺激响应任务,作者以多孔硅橡胶的宽频阻尼性能研究了 CBLSTM 的可迁移性。宽频阻尼性能是一个典型的刺激-响应过程,可以看作是材料在不同频率的外部动态应力下的能量耗散响应。

 

 

图 7:三种模型对多孔硅橡胶阻尼性能的预测对比。

 

结果表明,CBLSTM 在宽频阻尼性能预测过程中同样具有比 CNN与 BLSTM 模型有更高的预测精度。

 

目标性能的设计与实验验证

 

与传统的材料设计方法相比,DL 带来的材料设计革命在探索巨大潜在设计空间中感兴趣的材料特性方面提供了更高的效率。

 

 

图 8:具有超长应力平台的多孔硅橡胶应力-应变曲线的设计和实现。

 

基于训练好的 CBLSTM 模型,作者仅花费 3.55 秒即成功预测了 21500 个不同结构的多孔硅橡胶应力应变曲线,从中筛选出具有超长应力平台的结构并通过 3D 打印实现,验证了其存在与预测高度吻合的宽平台应力应变曲线,这种理想的超弹材料压缩应力应变曲线在传统随机多孔硅橡胶中是不存在的。更重要的是,具有所设计结构的多孔硅橡胶的预测应力应变曲线几乎与测试曲线一致,这表明 CBLSTM 模型可以用作一种有效的预测工具,无需大量实验即可设计出目标特性的材料。

 

综上所述,CBLSTM 模型具有探索材料动力学过程的能力,有望成为先进材料设计的有力工具,也有望用于探索材料在复杂工作条件下结构-性能的演化机制。尤其是作为具有时空特征以及分层学习机制的神经网络模型,其有效减少了对数据量的需求,为深度学习应用于数据稀疏的材料科学领域提供了一种有效工具。

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注