近日,上海大学材料基因组工程研究院张统一院士团队孙升研究员和熊杰助理研究员近日在计算材料著名期刊《npj Computational Materials》上发表了机器学习指导材料设计的最新研究成果(“MLMD: a programming-free AI platform to predict and design materials”,10:59,2024)。上海大学材料基因组工程研究院为本论文的第一完成单位和通讯单位,广州市材料信息学重点实验室为本论文的共同第一作者单位,上海市力学信息学前沿科学基地、之江实验室、香港科技大学(广州)功能枢纽为论文的合作单位。上海大学21级博士生马家轩和香港科技大学(广州)23级博士生曹斌为共同一作,上海大学材料基因院孙升研究员和熊杰助理研究员为共同通讯作者。
图1. MLMD平台的架构和功能模块
材料基因工程的研发理念深刻变革了材料研发范式,提高研发效率,降低研发成本。材料基因工程研发理念的核心是材料信息学,人工智能技术是材料信息学的核心工具,用好材料信息学需要具备较好的编程基础和能力,这一门槛限制了很多材料领域研发人员对材料信息学的应用。为解决此问题,我们开发了一个基于web端的界面友好的AI材料设计平台MLMD(Machine Learning for Materials Design),平台集成了材料信息学常用的机器学习算法,包含特征工程,回归预测、分类预测和聚类。平台还针对材料设计的需要,集成了随机优化算法用于单目标或者多目标的材料设计,开发了贝叶斯主动学习算法模块解决模型准确度和材料领域小数据的问题,平台还集成了基于迁移学习材料设计流程框架。
图2. 单目标/多目标材料设计流程图
MLMD平台包含了三个主要的材料设计流程:模型推理、代理优化和主动学习。模型推理和代理优化的效率取决于预测模型的鲁棒性,而模型性能则受限于可用数据的质量。在代理优化中,训练好的预测模型被集成到随机优化算法中,以加速材料设计。主动学习模块利用贝叶斯理论,平衡探索和开发,以制定最优的材料设计策略,推荐当前最优的材料参数。针对推荐参数开展新的实验或计算,不仅可以验证ML预测,还为数据集提供新数据,用于主动学习新一轮循环。
MLMD平台通过对6类材料数据开展的示例性研究显示,平台可以仅通过鼠标点击式操作的方式,完成材料的性能预测和优化设计。
工作得到了国家重点研发计划(编号:2022YFB3707803)、国家自然科学基金项目(编号:12072179、11672168)、之江实验室重点研发项目(编号:2021PE0AC02)和上海浦江人才项目(编号:23PJ1403500)的资助。
图3. 代理优化RAFM钢设计结果
图4. 主动学习AlCoCrCuFeNi高熵合金设计结果
文章链接:https://doi.org/10.1038/s41524-024-01243-4
平台链接:matdesign.top
源码链接:https://github.com/Jiaxuan-Ma/MLMD